腾讯混元 – T1正式版发布,技术亮点突出
腾讯正式推出混元大模型系列的正式版混元 -T1。该模型以混元中等规模底座为基础,通过大规模后训练,在推理能力上实现显著增强,尤其在深度思考与复杂问题解决方面成果显著。自今年2月混元T1-Preview上线,用户就体验到其快速且深刻的思考过程,此次正式版的推出更是产品的一次重要升级。
独特基座与架构助力性能提升
混元 – T1研发团队选用行业领先的TurboS基座,这是一种超大规模Hybrid-Transformer-MambaMoE模型。在处理长文本推理时,TurboS展现出独特优势,成功解决上下文丢失与长距离信息依赖难题。同时,优化后的Mamba架构在保持信息捕捉能力的情况下,大幅降低计算资源消耗。官方数据显示,相同部署条件下,混元- T1解码速度提升两倍。
强化学习训练提升推理与偏好对齐
后训练阶段,团队将96.7%的算力投入强化学习训练,致力于提升模型推理能力以及与人类偏好的对齐优化。团队收集数学、逻辑推理、科学及代码等多领域世界理科难题,采用课程学习方式,逐步增加数据难度,让模型在各类推理任务中表现卓越。
体验入口便捷开启
若想体验混元 -T1,可通过此链接:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1
© 版权声明
文章版权归作者所有,未经允许请勿转载。