腾讯混元-T1语言模型:性能卓越的新势力

AI快讯2个月前发布 niko
4 0
AiPPT - 一键生成ppt

混元-T1强势登场 :腾讯新近发布了混元-T1大型语言模型,宣称其推理能力可与OpenAI的顶尖推理系统比肩。

强化学习助力 :混元-T1开发高度依赖强化学习,超96.7%训练后算力用于提升逻辑推理及与人类偏好的一致性。

基准测试显能 :在MMLU-PRO评估、GPQA-diamond测试、MATH-500基准测试等多项测试中,混元-T1展现强大性能,成绩优异。

创新训练方法 :腾讯采用课程学习法逐步增加任务难度,还开发自我奖励系统,用早期版本评估新版本输出以提升性能。

独特架构优势 :混元-T1采用Transformer Mamba混合架构,处理长文本速度是传统模型两倍。

开放应用拓展 :目前,混元-T1已通过腾讯云对外开放,并在Hugging Face提供演示,成为中国科技巨头AI竞争新举措。

© 版权声明
Trea - 国内首个原生AI IDE