科研人员青睐的AI模型：o3-mini、DeepSeek-R1等各展优势

AI快讯1年前 (2025)发布 niko

科研人员的AI模型新宠

在科研领域，新的AI工具不断涌现。从数学问题求解到医学诊断，再到代码编写与论文创作，AI工具潜力巨大。研究人员与《自然》杂志分享了当下最青睐的几款模型。

o3-mini：推理领域的得力助手

OpenAI一直是LLM领域的焦点，2022年推出 chatgpt后，去年又发布一系列先进模型，o3-mini便是其中出色的推理模型。它速度快且对注册用户免费开放，通过「思维链」模拟人类推理过程，在科学和数学领域的基准测试中表现突出，擅长处理编程问题等技术任务，虽无法与数学家相比，但为科研人员处理复杂问题提供了有力支持。此外，OpenAI还推出「深度研究」功能。

DeepSeek-R1：全能且具潜力的模型

DeepSeek-R1能力与OpenAI的o1相当，APi使用成本却低很多，是开源权重模型，任何人可下载定制。其强项是解决数学问题、编写代码和提出假设，公布「思考过程」有助于提高输出质量，在医学诊断领域也有应用潜力。不过，它运行速度较慢，在防范有害内容方面措施较少。

LLaMA：科研界的老牌伙伴

MetaAI于2023年发布的Llama是一组开源权重模型，在科研界长期受青睐，因其可下载并在本地服务器运行，能保护敏感信息。研究人员基于它开发出多种应用，如预测材料晶体结构、模拟量子计算机输出结果等，但申请访问权限稍显麻烦。

Claude 3.5 Sonnet：编程的优质选择

由Anthropic开发的Claude 3.5Sonnet在硅谷备受赞誉，不仅编程能力强，还能解读视觉信息、远程操作计算机，写作风格也备受认可，在撰写科研基金申请等方面表现出色。在编程挑战基准测试中成绩优异，但完整集成需付费API。

Olmo 2：开源模型中的新星

Olmo2是出色的开源模型，附带训练数据和代码，有助于研究人员追溯偏差来源、理解算法输出，虽运行需专业知识，但随着免费课程增加，门槛逐渐降低。若使用受版权保护内容训练模型违法，它可能是安全选择。

# AI快讯

文章版权归作者所有，未经允许请勿转载。