DeepSeek:崛起的大语言模型引领中国AI创新浪潮

AI快讯1小时前发布 niko
0 0

春节之际,来自杭州的DeepSeek在科技领域崭露头角,震惊全球。这家于2023年7月创立的创新型科技公司,专注于大语言模型及相关技术开发,仅用一年多便成功推出大语言模型。

2025年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜。

1月20日,DeepSeek发布部分开源的“推理”模型DeepSeek-R1,解决科学问题能力与OpenAI的GPT-4不相上下。本周早些时候,又推出能根据文本提示生成图像的Janus-Pro-7B模型,功能与OpenAI的DALL-E 3和Stable [Diffus](https://ai-kit.cn/sites/5221.html)ion相似,且计算成本远低于OpenAI。

DeepSeek-R1的表现虽震惊全球科技界,但中国国内研究人员认为其成功在意料之中。中国2017年宣布计划在2030年前成为世界AI领域领导者,对LLM公司巨额投资,拥有众多相关博士学位持有者。

同时,培养“AI人才”是中国发展AI事业首要任务。到2022年,中国教育部批准440所大学开设AI专业本科学位,提供全球近一半顶尖AI研究人员。DeepSeek可能从政府对AI教育和人才培养投资中受益,其创始人梁文峰从中国顶尖大学招聘毕业生和博士研究生。

DeepSeek的成功是中国AI领域快速发展缩影,展示了中国在科技创新方面的实力与潜力。

© 版权声明

相关文章

暂无评论

暂无评论...