DeepSeek-R1引发AI科研新变革,科学家竞相探索其潜力

AI快讯4小时前发布 niko
0 0

两周前,一家中国公司推出的DeepSeek-R1震动美国股市。这款人工智能“推理”模型,兼具平价与强大的特质。

经反复测试,DeepSeek-R1在回答数学和科学问题方面,与OpenAI去年9月推出的o1模型不相上下,而OpenAI的推理模型向来被视为行业顶尖。

尽管R1在一些科研任务上尚有不足,但它为全球科学家提供了根据学科问题,量身训练定制款推理模型的机会。

俄亥俄州立大学的AI研究员HuanSun表示,基于其出色表现与低成本,Deepseek-R1能鼓励更多科学家在日常科研中使用大语言模型,且无需担忧成本问题,如今几乎所有AI领域的同事和合作者都在热议它。

对于科研人员而言,R1的平价与开源改变了传统模式。使用其应用编程接口,就能以远低于专利竞品的费用对模型提问,在线对话机器人DeepThink更是免费使用。科研人员还能在自己服务器上下载、免费运行和拓展该模型,这是闭源竞品o1无法做到的。

自1月20日推出后,大量研究人员基于R1或以其为灵感,尝试训练自己的推理模型。从开放科学AI资源库HuggingFace的数据可见一斑,模型发布一周内,Hugging Face上各版本的R1下载量就超300万次。

在科研任务方面,一些初步测试让R1执行数据型科研任务,这些任务源自生物信息、计算化学等领域真实论文,结果R1表现与o1相近。用API运行R1成本仅为o1的1/13,但“思考”时间更长。

R1在数学领域也开始崭露头角。英国牛津大学的数学家发现,R1在泛函分析领域给出的证明比o1更好。

R1以“open-weight”(开放权重)形式公开,下载了R1或其“蒸馏”小模型的科学家能通过额外训练提升其能力。此外,能在本地系统下载并部署R1,让科研人员可掌控数据和研究结果,对医学研究等涉及敏感隐私数据的学科尤为重要。

DeepSeek-R1也搅动了AI科研领域,它指出了优化其他模型的道路。DeepSeek通过将“推理”能力教授给其他大语言模型,创建了蒸馏模型。科研人员还在应用“强化学习”打磨其在特定任务上的应用。

不过,DeepSeek-R1并非完美,对话机器人DeepThink在一些简单任务上仍会失败。但不可否认,就其实际能力而言,它表现卓越。

© 版权声明

相关文章

暂无评论

暂无评论...