Meta新品引发关注热潮 :近日,AI 领域焦点齐聚 Meta。4 月 6 日,Meta 推出包含 LLaMA 4Scout(109B)、Llama 4 Maverick (400B)和 Llama 4 Behemoth 的 Llama 4 套餐。其凭借原生多模态MoE 架构、超越 DeepSeek V3 的性能及 1000 万 token 上下文等优势,一度备受业界看好,Llama 4 可谓出道即巅峰。
负面声音接踵而至 :然而好景不长,负面情况不断涌现。开发者实际测评发现,Llama 4 性能未达官方宣传,在代码、逻辑推理方面远逊于GPT-4o、DeepSeek R1 、gemini 2.5 pro。同时,有自称 Meta 内部员工爆料,Llama 4存在造假嫌疑,后训练阶段混入测试集提升基准分数,甚至技术负责人为此辞职,这一传闻使 Meta 陷入舆论风暴。
官方回应未消疑虑 :经过舆论发酵,Meta 官方回应称 Llama 4 不存在造假等行为,模型表现不一因发布时未完全稳定。Meta 首席 AI科学家 Yann LeCun 也转发澄清,但这番解释未能让大众信服,大家质疑为何模型未稳定就急于发布。
竞争压力下的决策 :在 Llama 4 发布前,Meta 上次发布新品是去年 7 月的 Llama 3.1 405B模型。今年年初,DeepSeek 凭借强大能力“出圈”,改变竞争格局,Meta 压力增大。有消息称,Llama 4 在测试中不如DeepSeek-V3,研发进程受影响。Meta 还设置作战室研究 DeepSeek,此次采用 MoE 架构或受其启发。但即便使用 20万显卡集群,Llama 4 性能仍未达预期。
信任危机凸显 :其实,Llama 系列从去年下半年起在开源领域影响力就大不如前,开发者转向 Qwen 系列和 DeepSeek。此次 Llama 4发布,大家本期待改进,却不想 Meta 深陷造假风波。目前社区还有开发者在找造假证据。无论造假与否,Llama 系列难现昔日辉煌,Meta面临巨大信任危机。如何修复 Llama 4 性能缺陷、重获开发者信任,成为 Meta 亟待解决的难题。原本的新品发布演变成“闹剧”,背离 Meta 初衷。