深度剖析DeepSeek:测评、成本、合规与行业影响

AI快讯6天前发布 niko
25 0
molica ai - 一站式AI工具集合

近期,DeepSeek成为全球热门话题,引发广泛讨论。然而,在众多自媒体和非专业报道解读中,存在不少对其关键信息的误导。

在对DeepSeek的认知上,过度神话与无脑贬低都不可取。从专业测评看,虽它对行业发展有促进价值,但谈及颠覆尚早。如模拟小球弹跳代码测试,与chatgpto3-mini相比,在物理学遵循程度上有差距,目前多测评显示各有千秋,未实现反超。

同时,微软称DeepSeek蒸馏了chatgpt结果,有人借此贬低。但实际测试发现,DeepSeek回答更发散,其训练或许部分利用蒸馏语料或做少许验证,对模型质量价值影响低,且开源后全球专家研究,翻车概率低。基于领先模型蒸馏验证优化自身模型是常见操作,但因联网API获取信息有限,多用于策略验证分析,非大规模训练。各领先大模型相互影响,迭代前进。

关于DeepSeek成本优势,也存在诸多误读。论文提及的训练成本有前提,未包含研发、硬件购置及前期测试迭代成本。实际上,其前期成本非几百万美金那么少,幻方虽有大量卡,但资金和资源有限,合理估算几年来累计投入十几亿甚至二十多亿人民币,相比美国同行较省钱。

此外,DeepSeek包含App和开源代码库。App未做全球分区和本地化处理,面临合规风险,一些国家地区有针对性政策;而开源系统采用大气开源协议,政府多不限制,国际巨头快速部署服务。目前DeepSeek生态蓬勃发展。

DeepSeek对行业影响深远,最大贡献是加速AI产业迭代效率,其新的优化思路和工程思想理念将被巨头吸收用于产品迭代。虽给中国厂商新思路,但CUDA也会与时俱进。不过,其训练成本低且开源,若黑灰产无约束使用,后果堪忧。

© 版权声明
智谱清言 - 国产最强AI模型

相关文章

AiPPT - 一键生成ppt