AI智商高达157引质疑：编码分数衡量智力的合理性争议

AI快讯2年前 (2024)发布 niko

近期在社交网络上掀起了一阵讨论风波，事件起因是一篇声称人工智能模型O3的智商（IQ）可能高达157的文章。据称，这一智商值意味着人类中的0.0075%才能达到此水平。更具体地讲，每13,333个人中才有一个这样的高智商个体。

从网友分享的数据来看，除了O3的惊人智商外，其他AI模型例如GPT-4o的IQ为115，o1 preview的IQ为123，o1的IQ为135，o1 pro的IQ为139，而o3 mini的IQ为141。若以每几人中有一个的标准来看，这样的智商分布无疑令人惊叹。

争议主要来自于智商的计算方法。有消息称，相关的智商值是基于Codeforces编码评级来进行粗略估计的，并假设参与者在竞争程序员排名时处于前15%的位置。显然，这样的计算方式备受质疑。

进一步来看，有关AI模型在数学竞赛中的表现也引起了人们的注意。从2024年AIME数学竞赛题目测试的结果来看，AI模型的数学能力在短短七个月内实现了飞跃式提升。

关于O3智商的评估值是否可信，有人通过查阅不同来源的数据来验证。例如，在Mensa Norway智商测试中，o1的测试结果为133，与之前表格中的估计值135相差不大，这在一定程度上验证了O3估计智商的可靠性。

O3的高智商值一出，立刻在网络上引爆了大量评论。有网友直言不讳地认为：“这些数据根本不能代表智商。他们用编码表现的z分数代表智商。但编码不是智商测试。” 对此，有人回应说：“这是一种基于相关性的转化，但这个相关性较弱，且它转化为机器智能的效果尚不明确。”

智商通常被认为是评估人类的一个指标，用来评估与智力相关的特定技能。而这幅智商评估图基于人工智能擅长的单一指标来假设广义智能，并未使用智商测试得出此结论，而是根据与智商相关的指标进行推断。综上所述，人们对所谓的“O3智商高达157”并不买账，可能这又是一场炒作。

参考链接提供了进一步讨论的平台。

本文经过整合讨论，为你提供对这场智商评估争议的深入了解。

文章版权归作者所有，未经允许请勿转载。