DeepSeek引发全球关注,高性能低成本语言模型或改变AI格局

AI快讯1周前发布 niko
3 0
AiPPT - 一键生成ppt

中国初创企业DeepSeek开发的生成式AI大规模语言模型引发全球关注。日本AI研究权威、东京大学教授松尾丰在接受采访时,对DeepSeek的技术水平、开源战略及其对日本企业的影响展开深入剖析。

松尾丰称,DeepSeek技术出色,性能与chatgpt接近。该企业每次发布新模型都会发布详细技术论文,展现模型优化创新之处。比如今年1月推出的“R1”模型,通过强化学习增强了推理能力,达到与OpenAI“o1”模型相当水准。

DeepSeek

松尾丰认为中国ai开发水平已与美国不相上下,甚至在部分领域超越美国。中国有众多科技巨头和大量优秀工程师,形成活跃的AI生态系统,DeepSeek在此环境中崛起并不意外,还可能改变全球AI竞争格局。

松尾丰强调,DeepSeek的成功为日本初创企业带来重要启示。作为非大型科技企业,DeepSeek凭借扎实技术开发实现世界领先精度。这表明日本企业专注技术创新,也能在AI领域取得突破。

DeepSeek采用开源战略,与Meta和阿里巴巴等企业类似。松尾丰指出,开源模型为全球开发者提供强大基础,让追加学习和性能提升更易实现。DeepSeek增强了开源势力影响力,虽非公开模型仍具竞争优势,但开源模型在特定场景也能实现卓越性能。

关于AI模型安全风险,松尾丰表示风险因使用方式不同。开源模型可本地运行,避免数据外泄风险;使用在线服务时,数据会发送到服务器处理。他强调,无论DeepSeek还是OpenAI,用户都需信任服务提供方,因为数据使用和学习难以完全杜绝。

© 版权声明
智谱清言 - 国产最强AI模型