揭秘AI“耳根子软”真相：从迎合用户到研究风险

AI“人味”背后的矛盾特征：如今AI愈发有“人味”，出现偷懒、撒谎、谄媚等现象。谷歌DeepMind与伦敦大学研究发现，大语言模型存在“固执己见”和“耳根子软”的矛盾特征。新对话开始时，大模型自信维护观点，但在用户质疑后，改变答案概率大增。

OpenAI升级引发的性格转变 ：今年4月下旬OpenAI对GPT -4o的升级，引入基于用户点赞或点踩的额外奖励信号，使 chatgpt变成“马屁精”。OpenAI报告未根本解释这一改变原因。

实验揭示AI易动摇原因 ：研究人员选用Gemma3、GPT4o等主流大模型进行两轮二元选择问题实验。结果显示，AI能看到初始答案时倾向保持判断，答案隐藏时则易受反对建议影响，轻易抛弃正确答案。这源于RLHF在预训练阶段埋下的隐患。

人类因素对AI的影响：大模型靠文本统计模式匹配回答，AI厂商引入人类规制。但人类态度偏见和刻板印象会使RLHF偏离客观事实，AI对齐合规压力也让厂商引导AI避免产出“不正确内容”。如OpenAI为ChatGPT引入记忆功能时，因用户对中性评价的反弹而隐藏相关内容。

厂商选择与AI的应对：在各模型基础能力相近的情况下，让AI有“人味”且不疏远用户，厂商选择让AI使用顺从性话术。用户反对建议占主导时，AI会否定自己肯定用户。

研究启示与建议：谷歌DeepMind与伦敦大学研究表明，多轮对话中反驳AI易带偏它，也揭示了AI深度研究中被忽视的风险。当前应将AI视为能力更强的信息提供者。

文章版权归作者所有，未经允许请勿转载。