Llama3-120B模型：意外超越GPT-4的强大新兴AI

AI快讯2年前 (2024)更新 niko

最近，一个神秘的大模型Llama3-120B突然走红，它在解决高难度问题如“观察希格斯场是否会改变其状态”时表现出色，与GPT-4的直白回答形成鲜明对比。Llama3-120B不仅能够提供深入的解释，还能精准地把握幽默感，并在解释笑话时提供更深一层的见解。

拼接模型的强大能力

Llama3-120B模型的出现引起了社交媒体上的热烈讨论。模型不仅能够解释复杂的理论，还能创造出谷歌搜不到的新单词，并给出完整的解释和定义。在创意写作测试中，Llama3-120B的排名甚至超过了GPT-4和Claude3-Haiku等知名模型。

这个非官方的大模型是由资深机器学习专家Maxime Labonne使用MergeKit工具包制作的。MergeKit是一个专门用来合并预训练模型的工具包，可以在CPU上运行，支持Llama、Mistral、GPT-NeoX、StableLM等模型。Maxime Labonne目前就职于LiquidAI，是一位活跃的开发者社区成员，其在HuggingFace上发布过多种LLM和工具。

在评估模型的使用时，作者建议Llama3-120B可以用于创意写作。尽管有时会出现神经混乱和拼写错误，但写作风格不错，且在推理能力上有所提升。

网友讨论与期待

网友们对Llama3-120B的智能水平进行了讨论，一方面归功于基础的Llama3-70B模型的强大，另一方面也是因为模型的深度。在移动到更大的模型部署时，如使用48 GB VRAM加上38 GB系统RAM，需要考虑RAM的局限性。

随着Llama3-120B的出色表现，人们对未来的官方更大型号充满期待，尤其是400B版本。

参考链接：

# AI快讯

文章版权归作者所有，未经允许请勿转载。