腾讯混元 – T1正式版发布,多维度创新提升推理能力

AI快讯1个月前发布 niko
3 0
AiPPT - 一键生成ppt

腾讯混元 – T1正式版发布,技术亮点突出

腾讯正式推出混元大模型系列的正式版混元 -T1。该模型以混元中等规模底座为基础,通过大规模后训练,在推理能力上实现显著增强,尤其在深度思考与复杂问题解决方面成果显著。自今年2月混元T1-Preview上线,用户就体验到其快速且深刻的思考过程,此次正式版的推出更是产品的一次重要升级。

独特基座与架构助力性能提升

混元 – T1研发团队选用行业领先的TurboS基座,这是一种超大规模Hybrid-Transformer-MambaMoE模型。在处理长文本推理时,TurboS展现出独特优势,成功解决上下文丢失与长距离信息依赖难题。同时,优化后的Mamba架构在保持信息捕捉能力的情况下,大幅降低计算资源消耗。官方数据显示,相同部署条件下,混元- T1解码速度提升两倍。

强化学习训练提升推理与偏好对齐

后训练阶段,团队将96.7%的算力投入强化学习训练,致力于提升模型推理能力以及与人类偏好的对齐优化。团队收集数学、逻辑推理、科学及代码等多领域世界理科难题,采用课程学习方式,逐步增加数据难度,让模型在各类推理任务中表现卓越。

体验入口便捷开启

若想体验混元 -T1,可通过此链接:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1

© 版权声明
Trea - 国内首个原生AI IDE