國際最新研發(fā)深度學(xué)習(xí)模型:可預(yù)測DNA變異影響助力開發(fā)新療法
中新網(wǎng)北京1月30日電 (記者 孫自法)國際學(xué)術(shù)期刊《自然》最新發(fā)表一篇基因組學(xué)論文稱,谷歌研究團(tuán)隊(duì)研發(fā)的一款深度學(xué)習(xí)模型AlphaGenome,能預(yù)測長達(dá)100萬堿基對的DNA序列的功能。
研究團(tuán)隊(duì)認(rèn)為,基于能預(yù)測DNA序列變異如何影響不同生物過程,AlphaGenome可用于理解遺傳疾病、改進(jìn)基因檢測,并為開發(fā)新療法提供信息。

該論文介紹,基因變異會(huì)影響生物學(xué)過程并可能引發(fā)疾病,但理解DNA序列變化如何影響其功能是個(gè)難題。大多數(shù)變化(約98%)發(fā)生于非編碼區(qū)域(不編碼蛋白質(zhì)但影響基因表達(dá)的DNA區(qū)域),使得預(yù)測其影響變得困難。要解決這一問題需要計(jì)算模型,現(xiàn)有的方法在序列長度和預(yù)測強(qiáng)度上必須做出取舍,但AlphaGenome能在長DNA序列中做出高分辨率預(yù)測。
在本項(xiàng)研究中,谷歌DeepMind團(tuán)隊(duì)展示了AlphaGenome的能力,這一深度學(xué)習(xí)模型用人類和小鼠基因組訓(xùn)練來學(xué)習(xí)DNA序列如何影響不同生物學(xué)過程。AlphaGenome可以即時(shí)預(yù)測5930種人類或1128種小鼠遺傳信號(hào),這些信號(hào)與特定功能有關(guān),如基因表達(dá)、剪接(基因組的切割與重組)和蛋白質(zhì)修飾。在26項(xiàng)變異效果預(yù)測評(píng)估中,其結(jié)果在25項(xiàng)中與現(xiàn)有頂尖模型表現(xiàn)相當(dāng)或更優(yōu)。因此,該模型優(yōu)勢在于能同時(shí)對多種遺傳信號(hào)和生物學(xué)結(jié)果進(jìn)行多重預(yù)測。
研究團(tuán)隊(duì)總結(jié)表示,進(jìn)一步改進(jìn)這一工具或能拓展其應(yīng)用,例如增加涵蓋的物種,或拓展模型能識(shí)別的非編碼序列范圍。未來,AlphaGenome有望深化對DNA序列變異引發(fā)的復(fù)雜生物學(xué)結(jié)果的理解。(完)






































京公網(wǎng)安備 11010202009201號(hào)