近日,哈佛大学、布朗大学以及图宾根大学的研究者联合发表论文《LINKing forward – pass dynamics in Transformersand real – time human processing》,深入探究Transformer模型的“思考过程”与人类大脑实时认知的相似性。
研究方法:聚焦处理负载指标论文作者记录Transformer每一层的输出与变化,提出不确定性、信心、相对信心、boosting等“处理负载”指标。这些指标体现了AI每一层“思考”时对答案信心的变化,如同人类做题时的熟练、犹豫、修正等过程。
实验结果:人机认知“弯路”一致 论文通过多个实验进行人机对比。在“首都杀手题”中,LLaMA -2模型中间层信心押宝在错误答案上,后半程才修正,与人类下意识犯错后反思的过程相同;“鲸鱼归属”实验里,人类鼠标漂移与AI模型信心指标先偏后正同步;“逻辑陷阱”中,题目绕时,AI和人类都会在中间层陷入直觉误区;“图片辨认”上,VisionTransformer开始信心分散,后聚焦正确类别,和人类“雾里看花”的过程相似。
研究启示:关注AI思考过程以往将AI作为“黑箱”只看输入输出,该研究表明,应关注AI内部“思考过程”。AI遇难题会“走弯路”“卡壳”,不同任务和模型规模下思考路径有变化,且这种动态过程是自然训练所得。这或许能帮助我们发现影响人类处理的因素,反向指导人类实验设计。
© 版权声明
文章版权归作者所有,未经允许请勿转载。