GPT4.5再掀波澜,图灵测试是否已跟不上AI发展步伐?

AI快讯4周前发布 niko
4 0
AiPPT - 一键生成ppt

图灵测试再引关注,GPT表现亮眼 。近期,GPT4.5参与图灵测试,结果惊人,它被当成人类的概率甚至高于真人。此前在2024年,GPT -4挑战图灵测试,以54%的胜率通过,远超30%的及格线。当时研究让500名参与者与不同“对话者”交流,近六成参与者被GPT -4“忽悠”,而其他AI未达及格标准。

图灵测试“屹立不倒”背后。在计算机用打孔纸带存储的时代,图灵提出该测试。那时人们对人类思维本质认识不足,研究机器思考更是困难。图灵认为不纠结本质,直接看表现即可,若机器有智慧就应表现得像人。然而直至今日,科学家仍未完全搞清人类大脑运作方式,这也是图灵测试仍有影响力的原因。

图灵测试饱受争议。自提出以来,图灵测试反对声不断。1980年,加州伯克利一位教授认为其无用,举例说明存在只看答案不看过程的缺陷。1966年,MIT教授开发的聊天机器人ELIZA用简单模糊回复骗过部分人类。2014年,有程序员让程序伪装成13岁乌克兰男孩儿通过测试,引发对测试真实性的质疑。

新测试被看好,图灵测试或过时。2014年,著名科技杂志提出威诺格拉德测试才是未来,该测试通过常识性填空题考察AI,让AI犯难。2020年,亚马逊首席科学家也呼吁淘汰图灵测试,纽约大学教授直言其早过时。而且图灵本人未严格定义该测试,导致标准模糊,如今AI发展迅猛,其低标准已跟不上趟。

正确看待图灵测试意义。人们纠结图灵测试是否过时,或许并非图灵本意。他只是在一个领域提出可行解法,希望看到人类进步。如今chatgptClaude等AI展现强大能力,我们不应只关注图灵测试结果,而应看到AI在更多领域的发展。

© 版权声明
Trea - 国内首个原生AI IDE