DeepSeek引发全球关注，高性能低成本语言模型或改变AI格局

AI快讯1年前 (2025)发布 niko

中国初创企业DeepSeek开发的生成式AI大规模语言模型引发全球关注。日本AI研究权威、东京大学教授松尾丰在接受采访时，对DeepSeek的技术水平、开源战略及其对日本企业的影响展开深入剖析。

松尾丰称，DeepSeek技术出色，性能与 chatgpt接近。该企业每次发布新模型都会发布详细技术论文，展现模型优化创新之处。比如今年1月推出的“R1”模型，通过强化学习增强了推理能力，达到与OpenAI“o1”模型相当水准。

松尾丰认为中国ai开发水平已与美国不相上下，甚至在部分领域超越美国。中国有众多科技巨头和大量优秀工程师，形成活跃的AI生态系统，DeepSeek在此环境中崛起并不意外，还可能改变全球AI竞争格局。

松尾丰强调，DeepSeek的成功为日本初创企业带来重要启示。作为非大型科技企业，DeepSeek凭借扎实技术开发实现世界领先精度。这表明日本企业专注技术创新，也能在AI领域取得突破。

DeepSeek采用开源战略，与Meta和阿里巴巴等企业类似。松尾丰指出，开源模型为全球开发者提供强大基础，让追加学习和性能提升更易实现。DeepSeek增强了开源势力影响力，虽非公开模型仍具竞争优势，但开源模型在特定场景也能实现卓越性能。

关于AI模型安全风险，松尾丰表示风险因使用方式不同。开源模型可本地运行，避免数据外泄风险；使用在线服务时，数据会发送到服务器处理。他强调，无论DeepSeek还是OpenAI，用户都需信任服务提供方，因为数据使用和学习难以完全杜绝。

文章版权归作者所有，未经允许请勿转载。