Centaur模型:模拟人类心智引发科学界争议与期待

AI快讯5秒前发布 niko
1 0
AiPPT - 一键生成ppt

7月2日,跨国团队在Nature杂志发表研究,推出名为Centaur的基础模型,宣称能“模拟人类心智”。然而同日,Science杂志报道引发科学界对该研究的审慎与质疑。

当前AI模型多为“专才”,而心理学界一直期望构建统一认知理论。Centaur模型的出现,似乎带来新希望。其研究团队来自德国HELMholtzAI研究计划、谷歌DeepMind、普林斯顿大学等。

Centaur的基石是“Psych-101”数据集,规模空前,涵盖多臂老虎机、决策制定等广泛认知领域知识,还囊括160项心理学实验中超6万名参与者的逐次试验数据。研究人员将这些数据转录成自然语言文本,使AI模型能学习理解人类行为。

Centaur以Meta的开源大模型LLaMA 3.170B为“大脑”,研究人员采用量化低秩适配(QLoRA)技术对其微调,仅用传统模型Llama的0.15%参数,就能模拟人类在160项心理学实验中的行为。此外,还开发了以Llama3.1 8B为基础的小型版本Minitaur,对硬件要求低。

Centaur能精准预测和模拟人类行为,泛化能力出色。在多种实验中,它能准确预测新参与者行为,即使在全新领域如逻辑推理、道德决策等也表现优异,还能“扮演”人类生成逼真行为。

令人惊喜的是,Centaur的内部运作与人类大脑活动模式共鸣。在全脑分析中,其表征在预测人类神经活动方面优于Llama的表征,表明微调使其内部表征与人类神经活动对齐。

研究人员还借助Centaur辅助理解人类决策过程。在多维度决策实验中,结合DeepSeek -R1,Centaur通过“科学遗憾最小化”方法,优化了对人类决策的解释。

但科学界对此持谨慎态度。受访专家指出,Centaur运行机制未必与人类心智相同,即便内部表征相似。大模型核心是统计模式匹配,现阶段不具备意识和因果推理能力。而且,Centaur在短时记忆、反应时间测试中有“超人”表现,说明其内部机制与人类认知局限性差异大,泛化能力存疑,也无法解释人类认知问题。此外,Psych- 101数据集虽规模大,但不足以全面覆盖人类认知机制。

© 版权声明
Trea - 国内首个原生AI IDE