Inception Labs的创新之举 :近日,名不见经传的InceptionLabs带来重磅消息,其开发出全球首个商业级扩散大模型Mercury,这一成果或许将对AI界发展产生深远影响。
Mercury的卓越性能 :在众多测试中,Mercury Coder表现出色,吊打GPT-4o Mini和Claude 3.5Haiku等模型。它不仅生成速度快,比专门优化过的模型还快10倍,且能在NVIDIAH100芯片上实现每秒超1000token的处理速度,而通常这需要定制AI芯片。
生成质量有保障 :从Artificial Analysis的测试坐标系可知,Mercury生成质量不错,虽目前不及顶尖的Claude3.5Haiku等,但考虑到其超高效率,已属难得。实际测试也验证了其生成效果良好。
带来新的思维方式:Mercury的意义不仅在于性能,更在于带来新可能。传统大语言模型多走Transformer路线,而Mercury基于Diffusion。Transformer是链式思维,Diffusion则是从模糊去噪到清晰。
Diffusion的优势与挑战:Transformer存在计算复杂度指数级增长的问题,限制了模型发展。Diffusion虽能节省资源、加快生成速度,但生成精度较难把握。Mercury的出现验证了Diffusion也能做Transformer的工作。
目前存在的不足:可惜的是,Mercury未公开技术文档,其模型规模相对较小,自定义提示词时出错概率高,生成稳定性一般。不过,它的成果仍值得关注,或许将为AI发展开辟新道路。
© 版权声明
文章版权归作者所有,未经允许请勿转载。