GPT-4o引领AI图像新潮流：从真实假照片到CCD风格创作

AI快讯1年前 (2025)发布 niko

当下，一位27岁的年轻人凭借自身能力，在未依赖父母和关系的情况下，获得了与世界首富的合照。不过，此合照并非实际拍摄，而是借助GPT -4o，依据Reddit上爆火的提示词生成的。在这个生成式AI盛行的时代，照片的真实性受到挑战，“眼见为实”的观念或许要重新审视。

如今社交平台上，周杰伦在各地标打卡、马斯克等名人在国内景点“合影”，甚至刘强东和王兴在上海外滩等地“握手言和”的照片屡见不鲜。这些照片均由AI生成，其逼真程度令人难以分辨。例如，一段看似“敷衍”的提示词，竟让GPT- 4o生成了一组如同真实摄影风格教程的图像。提示词刻意营造不完美，如模糊、过曝、角度尴尬、构图混乱等，反而使生成的图像更贴近真实世界。

随着这段提示词在各大平台传播，网友不断改进，形成了“真实假照片”的制作公式。不仅模拟物体效果惊艳，生成人像的水平也不容小觑。但该提示词也存在不足，模型生成的内容易出现视觉同质化，如生成汽车、自拍女性图像时缺乏个性。

此外，GPT -4o还能助力生成具有CCD风格的照片。使用名人形象生成的照片还原度更高，加入CCD相机型号可增强复古感。文中给出了不同风格照片的提示词模板，涵盖室内风、夜晚室外风、街拍风等多种类型。

GPT -4o的能力不止于此，它还能生成假发票。创投人士演示了用其生成账单、发票并叠加细节的流程，效果堪比复古做旧工艺。为应对AI图像难辨真假的问题，OpenAI为GPT- 4o生成的图片添加C2PA元数据标准，Google、Adobe等也在推广数字水印技术。

OpenAI未公开GPT -4o生图的具体原理，只提及它是嵌入在 chatgpt中的自回归模型，与基于扩散模型的DALL・E不同。自回归模型逐格构建图像，依赖局部上下文合理性，通过学习摄影瑕疵样本，模拟真实世界的摄影效果。

日本专家森政弘提出的“恐怖谷”理论表明，AI图像早期因过于完美易产生违和感，而GPT -4o适当引入“人类特有的笨拙”，避开了这一问题，让图像更真实、亲切。这或许是GPT -4o在图像生成方面的转折点，使我们在技术发达的当下，更怀念带有瑕疵的真实瞬间。

# AI快讯

文章版权归作者所有，未经允许请勿转载。