AI领域新动态:从技术探讨到未来展望
近日,红点创投的播客“Unsupervised Learning”邀请到了在AI领域履历丰富的David Luan与JacobEffron展开深度对话。DavidLuan曾是OpenAI早期员工,后历经谷歌、创立Adept,如今担任亚马逊AGI旧金山实验室负责人,他的见解无疑为当下AI发展提供了宝贵视角。
大模型的发展与局限
在访谈中,David Luan和Jacob Effron首先探讨了DeepSeek带来的影响。当DeepSeek R1发布引发股票暴跌时,DavidLuan认为人们最初理解有误,它其实是大模型发展从追求智能到兼顾高效的转折点。他还指出,未来模型发展可能是在内部实验室训练“教师模型”,再压缩成高效模型。此外,关于模型与强化学习结合,DavidLuan认为强化学习能发现新知识,将其与大型语言模型结合有望构建更强大系统,而当前模型在复杂领域泛化能力也比想象中强。
可靠智能体的构建之路
智能体(Agents)的现状与发展也是讨论焦点。DavidLuan回忆早期强大模型虽潜力巨大,但在实际任务执行上存在缺陷。此后,他所在团队致力于解决Agents问题,从谷歌时期研究“工具使用”,到创立Adept专注实用智能,都在不断探索。目前智能体可靠性仍待提高,将基础多模态模型转变为大型行动模型,需解决工程和规划推理两方面问题,且与模型交互方式也需创新,未来可能出现多模态用户界面。
模型评估与技术挑战
对于新模型评估,DavidLuan秉持方法论简洁性和基准测试误导性两个原则。他认为简洁有效的实现路径和避免与实际需求脱节的基准测试很关键。同时,他指出模型发展并非仅靠扩展计算能力,还需面对如替代梯度下降算法等技术挑战。此外,数据标注在测试时计算范式中仍重要,其能帮助模型学习基础知识和判断好坏。
AI领域的其他思考
在AI的其他方面,DavidLuan谈到亚马逊致力于构建通用智能系统,尤其通用智能Agent。他还分享对机器人进入家庭的看法,认为瓶颈在于建模扩散。视频模型领域也让他兴奋,其或能解决无明确验证器或模拟器时的问题。回顾OpenAI经历,他强调团队文化、内在动力人才的重要性,还认为各公司在技术积累上差异不大。