2024年图灵奖揭晓!强化学习之父Richard Sutton与导师Andrew Barto获殊荣

AI快讯3个月前发布 niko
16 0
AiPPT - 一键生成ppt

2024年图灵奖花落强化学习领域

计算机学会ACM宣布,Andrew G. Barto和Richard S.Sutton荣获2024年ACM图灵奖,旨在嘉奖他们为强化学习筑牢概念与算法根基。这一奖项,是对他们卓越贡献的高度认可。

RL之父及其博导的科研之路

Richard Sutton长期思索机器学习的基础问题。1978年起,他与导师AndrewBarto合作,在攻读博士及博士后研究期间,编写了早期的RL算法,让机器以试错方式获取知识。他们的理念与主流LLM理论存在分歧,Sutton认为LLM未真正实现从经验中学习。但近年来,RL愈发受到重视,如DeepSeek就运用RL训练AI。

强化学习的奥秘

AI领域聚焦于构建能感知和行动的智能体,强化学习(RL)便是在奖励信号引导下,让智能体找到更好行动方案的过程。其理念源于心理学和神经科学,历经多年发展,Barto和Sutton将其构建为通用框架,借鉴马尔可夫决策过程(MDP),开发出诸多基本算法,如时间差分学习等。深度强化学习技术更是让强化学习取得重大应用突破,在众多领域发挥作用。

两位获奖者的风采

Andrew Barto是马萨诸塞大学阿默斯特分校信息与计算机科学系荣誉退休教授,获众多奖项。RichardSutton是阿尔伯塔大学计算机科学教授等,也拥有诸多荣誉。他们凭借对强化学习的杰出贡献,赢得了学界的广泛赞誉。

© 版权声明
Trea - 国内首个原生AI IDE