近日,大模型聚合平台OpenRouter推出的OptimusAlpha引发广泛关注。上线仅三天,它的表现就令人惊叹,已处理772亿Token,平均每日超200亿,如今日Token处理量更是超过340亿,在相关排名中位居前列,于Trending榜单上荣登榜首。
在性能方面,OptimusAlpha支持百万上下文窗口,最大输出位达32K。其响应速度极快,首个Token延迟中位数仅0.81秒,输出速度中位数为每秒24.8个Token。而且,该模型主要面向现实世界任务,尤其在编程领域表现出色。有博主让其编写带购物车功能的电商网站、贪吃蛇游戏,甚至OCR文字识别应用,OptimusAlpha都能出色完成,设计合理且功能正常,在不少方面超越其他ai编程工具。
在各类测试成绩中,OptimusAlpha的Elo分数为1338,在榜单里排名第二。在SQL数据库查询任务上,取得最高平均成绩。在Aider榜单中,其编程能力与QuasarAlpha、Grok 3和中号o3-mini相近,略胜GPT-4.5-preview。在创意写作方面,Elo分数排名第四。
OptimusAlpha的神秘身份引发诸多猜测。当被询问身份时,它自称是chatgpt,具体版本为“基于GPT-4,知识截止时间2024年6月”。有人因Optimus名字联想到特斯拉的擎天柱机器人,认为其来自马斯克;也有人有不同看法。从已下线的QuasarAlpha线索来看,它最早于本月2日出现,有网友发现其在违规操作拒绝方式及Tokenizer bug方面与OpenAI相似,AI研究员SamPaech分析认为Quasar Alpha与OpenAI的GPT-4.5-preview极为相近,奥特曼也曾在推文中暗示QuasarAlpha身份。而Optimus Alpha中出现ChatGPT和Quasar Alpha的同款bug,Paech最新谱系图显示,与OptimusAlpha最接近的模型是今年3月27日更新的ChatGPT-4o。结合OpenAI刚泄露出的“GPT-4.1”及相关情况,OptimusAlpha来自OpenAI的可能性颇高。