GPT-4o展示强悍图像生成能力,网友惊叹技术飞跃

AI快讯7个月前更新 niko
17 0 0

“再见了,DALL-E”

OpenAI总裁Greg再次展现了GPT-4o的惊人操作,网友们对此纷纷表示惊叹,甚至有人将其与DALL-E联系起来。

实力展示,引发网友缅怀DALL-E

GPT-4o的发布以来,其图像生成能力尤其受到关注。网友发现,GPT-4o在处理任意图像组合时表现犹如打通了任督二脉,展现出非凡的能力。在一次迭代之后,从破碎的文本到风格一致、拼写正确的写作的跃迁,令网友们惊叹不已。

图像与文本的完美结合

GPT-4o在文本和图像的生成上展现了惊人的一致性,手部细节、光照处理以及后背上的Logo都无可挑剔,给人留下了深刻的印象。有网友表示,在一瞬间产生了错觉,以为是Greg本人在授课。而图像生成技术的飞跃进步也引起了人们的赞叹。

Omni团队揭秘

Omni团队负责人Prafulla Dhariwal在社交网络上感谢了团队成员,并透露他们的工作始于一年前。Prafulla Dhariwal毕业于MIT,加入OpenAI至今已有七年之久。他介绍称,GPT-4o是团队推出的第一个模型,也是OpenAI首个原生多模态大模型。随后,Dhariwal逐一介绍了团队成员及其贡献:James Betker负责多媒体生成和训练,Jamie Kiros专注于GPT-4o的视觉感知,Rowan Zellers致力于让模型如人类般理解视频,Alexis Conneau是音频AGI的主管,Gabriel Goh和Ishaan Gulrajani负责Scaling Law的研究,而Alex Nichol、Heewoo Jun、Li JING则保障了GPT-4o在图像和3D生成上的能力。

技术革命的开端

Greg的展示不仅仅是技术的展示,更是对未来使用计算机方式的一次革命性变革的预言。GPT-4o的出现,无疑为人工智能领域带来了新的挑战和机遇。

如果你已经体验过GPT-4o,欢迎在评论区分享你的感想和体验。

参考链接:
1. Greg的推特
2. Sam Altman的推特

© 版权声明

相关文章

暂无评论

暂无评论...