AlphaGenome:以百万碱基对序列预测数千分子特性的AI基因新突破

AI快讯6小时前发布 niko
4 0
AiPPT - 一键生成ppt

6月25日,谷歌DeepMind推出了一款名为AlphaGenome的AI模型,该模型可助力人们快速对基因变化的影响作出预测。

独特输入与预测能力:AlphaGenome如同“观察人类DNA的AI显微镜”,将长达100万个碱基对的长DNA序列作为输入,可预测数千种表征调控活性的分子特性。其预测属性丰富,涵盖基因在不同细胞和组织中的起止位置、基因剪接位置等。训练数据源于ENCODE、GTEx等大型公共联盟,覆盖数百种人类和小鼠细胞类型及组织的基因调控模式。

突出特点显著:与现存DNA序列模型相比,AlphaGenome具有多个独特亮点。它支持高分辨率的长序列上下文,能以单个碱基分辨率分析多达百万的DNA碱基,解决了先前模型在序列长度和分辨率间权衡的问题。同时具备综合多模态预测能力,解锁长输入序列高分辨率预测,为科学家提供更全面基因调控信息。还能高效进行变异评分,一秒内评估基因变异对多种特性的影响;拥有新颖的剪接连接模型,可直接从序列模拟剪接连接位置和表达水平,深入了解遗传变异对RNA剪接的影响。

基准测试表现优异:在超20项广泛的基因组预测基准中,AlphaGenome实现了先进性能。在对单个DNA序列预测时,24项评估中有22项优于现有最佳模型;预测变异调控效应时,26项评估中有24项与最佳外部模型相当或更优。且它是唯一能联合预测所有评估模态的模型,通用性凸显。

科研应用价值高:其通用性使科学家通过单个APi调用,就能同时探索变异对多种模式的影响,更快生成和测试假设。它学习到相对通用的DNA序列表征,为研究社区奠定基础,全面发布后可在不同数据集上调整以解决特定问题。同时,通过扩展训练数据,可扩展其功能,使模型更全面。

多领域研究助力:AlphaGenome的预测能力在多个研究途径发挥作用。在疾病理解方面,可精准查明疾病潜在病因,发现新治疗靶点,尤其适用于研究罕见变异。在合成生物学中,可指导合成DNA设计。在基础研究里,能加速对基因组的理解。例如,谷歌用其研究癌症相关突变机制,凸显了将非编码变异与疾病基因关联的能力。

局限性待突破:不过,AlphaGenome也存在局限性,如准确捕捉极远距离调控元件影响仍是挑战,且未设计用于个人基因组预测,不能全面展现基因变异与复杂性状或疾病的关联。

© 版权声明
Trea - 国内首个原生AI IDE