Llama3-120B模型:意外超越GPT-4的强大新兴AI

AI快讯5个月前更新 niko
15 0 0

最近,一个神秘的大模型Llama3-120B突然走红,它在解决高难度问题如“观察希格斯场是否会改变其状态”时表现出色,与GPT-4的直白回答形成鲜明对比。Llama3-120B不仅能够提供深入的解释,还能精准地把握幽默感,并在解释笑话时提供更深一层的见解。

拼接模型的强大能力

Llama3-120B模型的出现引起了社交媒体上的热烈讨论。模型不仅能够解释复杂的理论,还能创造出谷歌搜不到的新单词,并给出完整的解释和定义。在创意写作测试中,Llama3-120B的排名甚至超过了GPT-4和Claude3-Haiku等知名模型。

这个非官方的大模型是由资深机器学习专家Maxime Labonne使用MergeKit工具包制作的。MergeKit是一个专门用来合并预训练模型的工具包,可以在CPU上运行,支持Llama、Mistral、GPT-NeoX、StableLM等模型。Maxime Labonne目前就职于LiquidAI,是一位活跃的开发者社区成员,其在HuggingFace上发布过多种LLM和工具。

在评估模型的使用时,作者建议Llama3-120B可以用于创意写作。尽管有时会出现神经混乱和拼写错误,但写作风格不错,且在推理能力上有所提升。

网友讨论与期待

网友们对Llama3-120B的智能水平进行了讨论,一方面归功于基础的Llama3-70B模型的强大,另一方面也是因为模型的深度。在移动到更大的模型部署时,如使用48 GB VRAM加上38 GB系统RAM,需要考虑RAM的局限性。

随着Llama3-120B的出色表现,人们对未来的官方更大型号充满期待,尤其是400B版本。

参考链接

  1. Pushes boundaries of unorthodox language models
  2. Discusses the model performance in detail
  3. Analyses Llama3’s strength in open writing and creative questions
© 版权声明

相关文章

暂无评论

暂无评论...