Meta Llama 4发布引风波：性能质疑与造假传闻背后的信任危机

AI快讯1年前 (2025)发布 niko

Meta新品引发关注热潮 ：近日，AI 领域焦点齐聚 Meta。4 月 6 日，Meta 推出包含 LLaMA 4Scout（109B）、Llama 4 Maverick （400B）和 Llama 4 Behemoth 的 Llama 4 套餐。其凭借原生多模态MoE 架构、超越 DeepSeek V3 的性能及 1000 万 token 上下文等优势，一度备受业界看好，Llama 4 可谓出道即巅峰。

负面声音接踵而至 ：然而好景不长，负面情况不断涌现。开发者实际测评发现，Llama 4 性能未达官方宣传，在代码、逻辑推理方面远逊于 GPT-4o、DeepSeek R1 、gemini 2.5 pro。同时，有自称 Meta 内部员工爆料，Llama 4存在造假嫌疑，后训练阶段混入测试集提升基准分数，甚至技术负责人为此辞职，这一传闻使 Meta 陷入舆论风暴。

官方回应未消疑虑 ：经过舆论发酵，Meta 官方回应称 Llama 4 不存在造假等行为，模型表现不一因发布时未完全稳定。Meta 首席 AI科学家 Yann LeCun 也转发澄清，但这番解释未能让大众信服，大家质疑为何模型未稳定就急于发布。

竞争压力下的决策 ：在 Llama 4 发布前，Meta 上次发布新品是去年 7 月的 Llama 3.1 405B模型。今年年初，DeepSeek 凭借强大能力“出圈”，改变竞争格局，Meta 压力增大。有消息称，Llama 4 在测试中不如DeepSeek-V3，研发进程受影响。Meta 还设置作战室研究 DeepSeek，此次采用 MoE 架构或受其启发。但即便使用 20万显卡集群，Llama 4 性能仍未达预期。

信任危机凸显 ：其实，Llama 系列从去年下半年起在开源领域影响力就大不如前，开发者转向 Qwen 系列和 DeepSeek。此次 Llama 4发布，大家本期待改进，却不想 Meta 深陷造假风波。目前社区还有开发者在找造假证据。无论造假与否，Llama 系列难现昔日辉煌，Meta面临巨大信任危机。如何修复 Llama 4 性能缺陷、重获开发者信任，成为 Meta 亟待解决的难题。原本的新品发布演变成“闹剧”，背离 Meta 初衷。

# AI快讯

文章版权归作者所有，未经允许请勿转载。