腾讯新专利：独特训练方法提升大语言模型性能

AI快讯1年前 (2025)发布 niko

近日，天眼查App数据显示，腾讯科技（深圳）有限公司提交了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利申请。此项专利的独特之处在于，其训练方法引入了第一摘要文本与第二摘要文本，为大语言模型训练注入新元素。

按照专利描述，第一摘要文本和第二摘要文本承载的信息量存在差异，第一摘要文本更是涵盖正确语句与错误语句。借助对同一文本的这两种不同摘要展开对比学习，并分辨其中的正误语句，可有效规避因摘要文本单一引发的模型过拟合及生成不准确等问题。

该训练方法的创新成果显著，极大提升了模型的泛化性能，同时有效提高了模型的准确性。腾讯通过引入多样化的摘要文本内容，为大语言模型的训练过程带来更为高效、精准的优化提升。

文章版权归作者所有，未经允许请勿转载。