GPT-4o引领AI图像新潮流:从真实假照片到CCD风格创作

AI快讯2小时前发布 niko
0 0
AiPPT - 一键生成ppt

当下,一位27岁的年轻人凭借自身能力,在未依赖父母和关系的情况下,获得了与世界首富的合照。不过,此合照并非实际拍摄,而是借助GPT -4o,依据Reddit上爆火的提示词生成的。在这个生成式AI盛行的时代,照片的真实性受到挑战,“眼见为实”的观念或许要重新审视。

如今社交平台上,周杰伦在各地标打卡、马斯克等名人在国内景点“合影”,甚至刘强东和王兴在上海外滩等地“握手言和”的照片屡见不鲜。这些照片均由AI生成,其逼真程度令人难以分辨。例如,一段看似“敷衍”的提示词,竟让GPT- 4o生成了一组如同真实摄影风格教程的图像。提示词刻意营造不完美,如模糊、过曝、角度尴尬、构图混乱等,反而使生成的图像更贴近真实世界。

随着这段提示词在各大平台传播,网友不断改进,形成了“真实假照片”的制作公式。不仅模拟物体效果惊艳,生成人像的水平也不容小觑。但该提示词也存在不足,模型生成的内容易出现视觉同质化,如生成汽车、自拍女性图像时缺乏个性。

此外,GPT -4o还能助力生成具有CCD风格的照片。使用名人形象生成的照片还原度更高,加入CCD相机型号可增强复古感。文中给出了不同风格照片的提示词模板,涵盖室内风、夜晚室外风、街拍风等多种类型。

GPT -4o的能力不止于此,它还能生成假发票。创投人士演示了用其生成账单、发票并叠加细节的流程,效果堪比复古做旧工艺。为应对AI图像难辨真假的问题,OpenAI为GPT- 4o生成的图片添加C2PA元数据标准,Google、Adobe等也在推广数字水印技术。

OpenAI未公开GPT -4o生图的具体原理,只提及它是嵌入在chatgpt中的自回归模型,与基于扩散模型的DALL・E不同。自回归模型逐格构建图像,依赖局部上下文合理性,通过学习摄影瑕疵样本,模拟真实世界的摄影效果。

日本专家森政弘提出的“恐怖谷”理论表明,AI图像早期因过于完美易产生违和感,而GPT -4o适当引入“人类特有的笨拙”,避开了这一问题,让图像更真实、亲切。这或许是GPT -4o在图像生成方面的转折点,使我们在技术发达的当下,更怀念带有瑕疵的真实瞬间。

© 版权声明
Trea - 国内首个原生AI IDE