DeepSeek：崛起的大语言模型引领中国AI创新浪潮

AI快讯1年前 (2025)发布 niko

春节之际，来自杭州的DeepSeek在科技领域崭露头角，震惊全球。这家于2023年7月创立的创新型科技公司，专注于大语言模型及相关技术开发，仅用一年多便成功推出大语言模型。

2025年1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜。

1月20日，DeepSeek发布部分开源的“推理”模型DeepSeek-R1，解决科学问题能力与OpenAI的GPT-4不相上下。本周早些时候，又推出能根据文本提示生成图像的Janus-Pro-7B模型，功能与OpenAI的DALL-E 3和Stable [Diffus](https://ai-kit.cn/sites/5221.html)ion相似，且计算成本远低于OpenAI。

DeepSeek-R1的表现虽震惊全球科技界，但中国国内研究人员认为其成功在意料之中。中国2017年宣布计划在2030年前成为世界AI领域领导者，对LLM公司巨额投资，拥有众多相关博士学位持有者。

同时，培养“AI人才”是中国发展AI事业首要任务。到2022年，中国教育部批准440所大学开设AI专业本科学位，提供全球近一半顶尖AI研究人员。DeepSeek可能从政府对AI教育和人才培养投资中受益，其创始人梁文峰从中国顶尖大学招聘毕业生和博士研究生。

DeepSeek的成功是中国AI领域快速发展缩影，展示了中国在科技创新方面的实力与潜力。

# AI快讯

文章版权归作者所有，未经允许请勿转载。