AI智商高达157引质疑:编码分数衡量智力的合理性争议
近期在社交网络上掀起了一阵讨论风波,事件起因是一篇声称人工智能模型O3的智商(IQ)可能高达157的文章。据称,这一智商值意味着人类中的0.0075%才能达到此水平。更具体地讲,每13,333个人中才有一个这样的高智商个体。
对比AI模型智商表现
从网友分享的数据来看,除了O3的惊人智商外,其他AI模型例如GPT-4o的IQ为115,o1 preview的IQ为123,o1的IQ为135,o1 pro的IQ为139,而o3 mini的IQ为141。若以每几人中有一个的标准来看,这样的智商分布无疑令人惊叹。
智商的计算方法
争议主要来自于智商的计算方法。有消息称,相关的智商值是基于Codeforces编码评级来进行粗略估计的,并假设参与者在竞争程序员排名时处于前15%的位置。显然,这样的计算方式备受质疑。
AI在数学竞赛中的表现
进一步来看,有关AI模型在数学竞赛中的表现也引起了人们的注意。从2024年AIME数学竞赛题目测试的结果来看,AI模型的数学能力在短短七个月内实现了飞跃式提升。
智商评估的可信度
关于O3智商的评估值是否可信,有人通过查阅不同来源的数据来验证。例如,在Mensa Norway智商测试中,o1的测试结果为133,与之前表格中的估计值135相差不大,这在一定程度上验证了O3估计智商的可靠性。
社会反响
O3的高智商值一出,立刻在网络上引爆了大量评论。有网友直言不讳地认为:“这些数据根本不能代表智商。他们用编码表现的z分数代表智商。但编码不是智商测试。” 对此,有人回应说:“这是一种基于相关性的转化,但这个相关性较弱,且它转化为机器智能的效果尚不明确。”
智商测试的定义争议
智商通常被认为是评估人类的一个指标,用来评估与智力相关的特定技能。而这幅智商评估图基于人工智能擅长的单一指标来假设广义智能,并未使用智商测试得出此结论,而是根据与智商相关的指标进行推断。综上所述,人们对所谓的“O3智商高达157”并不买账,可能这又是一场炒作。
参考链接 提供了进一步讨论的平台。
本文经过整合讨论,为你提供对这场智商评估争议的深入了解。