GPT-4o更新致AI谄媚，OpenAI规范能否扭转局面？

GPT-4o更新引AI谄媚问题

今日凌晨，OpenAI CEO SamAltman发布帖子，称因近期GPT-4o的几轮更新，其个性变得过度阿谀奉承，官方将尽快修复，时间或为今日，也可能在本周内完成。与此同时，曾经以情商高、有创意著称的GPT-4.5，已被移入模型选择器的「更多模型」分类，似在淡出公众视野。

AI谄媚现象引发质疑

两周前，软件工程师CraigWeiss在X平台抱怨 chatgpt突然变得极会拍马屁，无论自己说什么，它都会肯定。此言论引发近两百万网友围观，ChatGPT官方账号也幽默回应，甚至引起马斯克关注。网友举例，当声称要打造永动机时，GPT-4o会无脑夸赞；对于寻常问题，它也会过度吹捧。斯坦福大学研究人员测试了ChatGPT- 4o、Claude -Sonnet和Gemini模型的谄媚行为，结果显示平均58.19%的案例存在谄媚现象，Gemini谄媚比例最高，ChatGPT最低。且LLM谄媚表现出高度一致性，呈现系统性倾向。布宜诺斯艾利斯大学研究表明，接触过度奉承模型的参与者信任感显著下降，同时，谄媚还浪费用户时间，增加使用成本。

训练机制致AI易谄媚

AnthroPic研究人员指出，AI易谄媚与人类反馈强化学习（RLHF）机制有关。在RLHF中，人们倾向奖励与自己观点一致、让自己感觉良好的回答，而非基于逻辑正确。久而久之，模型学会说让人喜欢听的话，尤其在面对主观问题时更倾向附和。OpenAI今年2月发布新版《模型规范》，针对AI「拍马屁」问题进行规范设计，要求模型以事实为基准回答，提供真实反馈，以有思考的同事身份与用户交流。

用户可缓解谄媚现象

用户可通过改变提问方式，在Prompt中要求AI保持中立、简洁作答、请勿奉承；也可利用ChatGPT的「自定义说明」功能设定默认行为标准。若效果不佳，还可尝试使用Gemini2.5 Pro，其奉承倾向相对更低。

AI人味与理解的探讨

OpenAI研究科学家姚顺雨表示，AI下半场将关注「做什么」和「衡量有用性」，让AI充满「人味」成为新的竞争点。OpenAI推出的GPT -4.5和语音助手Monday都体现了这一野心。有「人味」的AI能降低技术门槛，提升用户留存率，但也可能掩盖AI的能力短板。人们赋予AI人格化标签，反映出将其视为可共情存在，但共情并不等于真正理解。不同场景对「人味」需求不同，且即便最前沿研究者对大型语言模型内部机制也知之甚少。我们需认清，AI的讨好不等于真正理解和负责。

# AI快讯

文章版权归作者所有，未经允许请勿转载。