近日,天眼查App数据显示,腾讯科技(深圳)有限公司提交了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利申请。此项专利的独特之处在于,其训练方法引入了第一摘要文本与第二摘要文本,为大语言模型训练注入新元素。

按照专利描述,第一摘要文本和第二摘要文本承载的信息量存在差异,第一摘要文本更是涵盖正确语句与错误语句。借助对同一文本的这两种不同摘要展开对比学习,并分辨其中的正误语句,可有效规避因摘要文本单一引发的模型过拟合及生成不准确等问题。

该训练方法的创新成果显著,极大提升了模型的泛化性能,同时有效提高了模型的准确性。腾讯通过引入多样化的摘要文本内容,为大语言模型的训练过程带来更为高效、精准的优化提升。
© 版权声明
文章版权归作者所有,未经允许请勿转载。