DeepMind人工智慧模型AlphaGenome解析人體DNA「暗基因體」 或加速疾病與藥物發現
AI model from Google's DeepMind reads recipe for life in DNA
作者: James Gallagher | 時間: Wed, 28 Jan 2026 16:03:22 GMT | 來源: BBC
f t
研究人員表示,Google DeepMind開發的人工智慧模型可能徹底改變我們對DNA的理解——DNA是構建和運作人體的完整藍圖——以及其對疾病與藥物發現的影響。
該模型命名為AlphaGenome,可協助科學家探究為何DNA的微小差異會使我們面臨高血壓、失智症和肥胖等疾病風險。
它也能大幅加速我們對遺傳疾病和癌症的理解。
模型開發者承認其並不完美,但專家已將其描述為「難得的技術成就」及「基因組人工智慧領域的重大里程碑」。
DeepMind研究工程師娜塔莎·拉蒂舍娃(Natasha Latysheva)表示:「我們將AlphaGenome視為理解基因體中功能元件作用的工具,希望這能加速我們對生命密碼的基礎認知。」
人類基因體由三百億個DNA編碼組成,以字母A、C、G和T表示。
其中約2%為基因,負責編碼人體生長和運作所需的所有蛋白質。其餘98%較少被理解,被稱為「暗基因體」,在調控基因使用方式上扮演關鍵角色,也是許多與疾病相關突變的發現處。
AlphaGenome可同時分析百萬個編碼,協助解開「暗基因體」之謎。
它不僅能預測基因位置,還能推測「暗基因體」的影響,例如如何調控基因表現(基因活性強弱或受抑制程度)及基因剪接(人體利用單一基因製造不同蛋白質的機制)。
關鍵在於,該模型能預測基因編碼中僅變更單一字母的影響。
拉蒂舍娃表示,她對該人工智慧模型理解致病突變及定位罕見遺傳疾病成因的潛力感到「非常興奮」。
她補充道,此模型可用於「為藥物標靶發現拼湊更多拼圖,最終促進新藥開發」。
未來也可能應用於合成生物學,設計可用於基因療法的新型DNA序列。
AlphaGenome已發表於《自然》期刊,並於去年開放非商業使用,至今已有三千名科學家使用此工具。
艾希特大學的迦勒·霍克斯博士(Dr Gareth Hawkes)正利用它探究突變如何改變肥胖與糖尿病風險。
針對數萬人全基因組序列的研究雖已鑑定出相關變異,但這些變異常出現在暗基因體區域。
霍克斯向BBC表示:「這些變異直接影響某些我們尚未理解的重要生物過程。」
使用AlphaGenome可讓研究人員快速預測這些變異的作用,進而進行實驗驗證。
霍克斯指出:「這些預測有助於釐清這些基因變異可能影響的生物過程,並可能引導藥物開發。」
他補充:「雖不能說AlphaGenome已完全解決基因體的暗面,但確實是重大突破,我非常期待。」
癌症研究領域也將因該模型加速進展。
AlphaGenome已被用於預測驅動癌症的突變、潛在治療標靶,以及無關緊要的突變。
弗朗西斯·克里克研究所基因體學負責人羅伯特·戈德斯通博士(Dr Robert Goldstone)稱該模型為「基因組人工智慧領域的重大里程碑」,此突破因其「單從DNA序列預測基因表現的能力」堪稱「難得的技術成就」。
威康桑格研究所生成與合成基因體學負責人班·萊納教授(Prof Ben Lehner)表示,他們在超過五十萬項實驗中測試AlphaGenome,結果表現優異。
但他強調模型「遠非完美」,仍需大量改進工作。
萊納教授指出:「英國在基因體學、生物醫學研究和人工智慧三個領域均領先全球,三者結合將徹底改變生物學與醫學,這確實令人振奮。」
DeepMind團隊曾因開發預測人體蛋白質三維結構的AlphaFold系統,於2024年榮獲諾貝爾化學獎。
Google DeepMind科學與戰略計畫副總裁普什米特·科利(Pushmeet Kohli)表示:「我認為我們正處於科學進步的新起點,人工智慧將推動多項重大突破。」
AlphaGenome的運作方式不同於預測序列下一個詞彙的大型語言模型(如ChatGPT),而是專注於文字變化如何影響最終意義的「序列轉功能模型」。
該模型訓練於公開的人類與小鼠細胞實驗資料庫。
學界普遍認同此模型仍需改進,例如在預測遠距離基因調控(逾十萬個編碼距離)時準確度較低。
團隊也希冀提升模型在不同組織中的預測精準度。例如,大腦神經元與跳動心肌細胞擁有相同基因編碼,但因細胞類型不同,基因指令的運用方式使兩者具備不同特性。