DeepSeek-R1引发AI科研新变革，科学家竞相探索其潜力

AI快讯6个月前发布 niko

两周前，一家中国公司推出的DeepSeek-R1震动美国股市。这款人工智能“推理”模型，兼具平价与强大的特质。

经反复测试，DeepSeek-R1在回答数学和科学问题方面，与OpenAI去年9月推出的o1模型不相上下，而OpenAI的推理模型向来被视为行业顶尖。

尽管R1在一些科研任务上尚有不足，但它为全球科学家提供了根据学科问题，量身训练定制款推理模型的机会。

俄亥俄州立大学的AI研究员HuanSun表示，基于其出色表现与低成本，Deepseek-R1能鼓励更多科学家在日常科研中使用大语言模型，且无需担忧成本问题，如今几乎所有AI领域的同事和合作者都在热议它。

对于科研人员而言，R1的平价与开源改变了传统模式。使用其应用编程接口，就能以远低于专利竞品的费用对模型提问，在线对话机器人DeepThink更是免费使用。科研人员还能在自己服务器上下载、免费运行和拓展该模型，这是闭源竞品o1无法做到的。

自1月20日推出后，大量研究人员基于R1或以其为灵感，尝试训练自己的推理模型。从开放科学AI资源库HuggingFace的数据可见一斑，模型发布一周内，Hugging Face上各版本的R1下载量就超300万次。

在科研任务方面，一些初步测试让R1执行数据型科研任务，这些任务源自生物信息、计算化学等领域真实论文，结果R1表现与o1相近。用API运行R1成本仅为o1的1/13，但“思考”时间更长。

R1在数学领域也开始崭露头角。英国牛津大学的数学家发现，R1在泛函分析领域给出的证明比o1更好。

R1以“open-weight”（开放权重）形式公开，下载了R1或其“蒸馏”小模型的科学家能通过额外训练提升其能力。此外，能在本地系统下载并部署R1，让科研人员可掌控数据和研究结果，对医学研究等涉及敏感隐私数据的学科尤为重要。

DeepSeek-R1也搅动了AI科研领域，它指出了优化其他模型的道路。DeepSeek通过将“推理”能力教授给其他大语言模型，创建了蒸馏模型。科研人员还在应用“强化学习”打磨其在特定任务上的应用。

不过，DeepSeek-R1并非完美，对话机器人DeepThink在一些简单任务上仍会失败。但不可否认，就其实际能力而言，它表现卓越。

文章版权归作者所有，未经允许请勿转载。