Centaur模型：模拟人类心智引发科学界争议与期待

AI快讯1年前 (2025)发布 niko

7月2日，跨国团队在Nature杂志发表研究，推出名为Centaur的基础模型，宣称能“模拟人类心智”。然而同日，Science杂志报道引发科学界对该研究的审慎与质疑。

当前AI模型多为“专才”，而心理学界一直期望构建统一认知理论。Centaur模型的出现，似乎带来新希望。其研究团队来自德国HELMholtzAI研究计划、谷歌DeepMind、普林斯顿大学等。

Centaur的基石是“Psych-101”数据集，规模空前，涵盖多臂老虎机、决策制定等广泛认知领域知识，还囊括160项心理学实验中超6万名参与者的逐次试验数据。研究人员将这些数据转录成自然语言文本，使AI模型能学习理解人类行为。

Centaur以Meta的开源大模型LLaMA 3.170B为“大脑”，研究人员采用量化低秩适配（QLoRA）技术对其微调，仅用传统模型Llama的0.15%参数，就能模拟人类在160项心理学实验中的行为。此外，还开发了以Llama3.1 8B为基础的小型版本Minitaur，对硬件要求低。

Centaur能精准预测和模拟人类行为，泛化能力出色。在多种实验中，它能准确预测新参与者行为，即使在全新领域如逻辑推理、道德决策等也表现优异，还能“扮演”人类生成逼真行为。

令人惊喜的是，Centaur的内部运作与人类大脑活动模式共鸣。在全脑分析中，其表征在预测人类神经活动方面优于Llama的表征，表明微调使其内部表征与人类神经活动对齐。

研究人员还借助Centaur辅助理解人类决策过程。在多维度决策实验中，结合DeepSeek -R1，Centaur通过“科学遗憾最小化”方法，优化了对人类决策的解释。

但科学界对此持谨慎态度。受访专家指出，Centaur运行机制未必与人类心智相同，即便内部表征相似。大模型核心是统计模式匹配，现阶段不具备意识和因果推理能力。而且，Centaur在短时记忆、反应时间测试中有“超人”表现，说明其内部机制与人类认知局限性差异大，泛化能力存疑，也无法解释人类认知问题。此外，Psych- 101数据集虽规模大，但不足以全面覆盖人类认知机制。

# AI快讯

文章版权归作者所有，未经允许请勿转载。