AlphaGenome 釋出對生醫界的影響及其血液學應用：AlphaGenome 是什麼？重要嗎？

就在我還沒結束對 AlphaFold 強大的震撼，Google DeepMind 又釋出了 AlphaGenome 來用基因序列預測它的表現調節與變異下可能的疾病狀態，更讓我驚喜的是它們挑了個超難的 T 細胞急性白血病來試刀。

Jan 31, 2026

Google DeepMind 的 AlphaGenome 在 2026 年 1 月 28 日正式於《自然 Nature》期刊刊出。其實早在去年七月前，團隊就已經釋出這篇研究的 preprint，也有 Google 開發者讀書會錄了一個小時的討論影片。

這篇文章會是我自己慢慢讀之下的讀書筆記與心得，因為自己是位以臨床為主的血液科醫師，分子生物學稍有接觸但實務經驗不多，而生物資訊方面更有待精進，也希望有建議或想法的同好多多補充。

AlphaGenome 有什麼厲害之處？

基因是我們的遺傳資料，而基因怎麼樣表現，造就了各司其職的細胞。基因表現有異常，也會導致一系列的疾病。當我們拿到一段基因，就可以推知它怎麼樣表現，而基因有異常的狀況下，表現會如何改變，這就是「序列至功能模型 (sequence-to-function model, S2F)」試圖模擬的。

AlphaGenome 正是目前表現最佳 (state-of-the-arts, SOTA) 的 S2F。

在此之前，S2F 的挑戰有兩者：

廣度或深度的取捨：預測精準至各別鹼基但短 (≤ 10 kb) 的序列 (e.g., SpliceAI, BPNet, ProCapNet) v. 長序列 (200–500 kb) 但解析度低 (128-bp or 32-bp bins) 的預測 (e.g., Enformer, Brozoi)
泛用或特異的衡量：需要有夠多的基因組資料並連結表現型，才能知道正常與病態和非病態的變異 (variant effects)。知道什麼是正常，也要知道什麼是異常。

AlphaGenome 在基因表現的各階段，細緻的過程包括轉錄 (transcribe)、剪裁 (splicing)，它的基因、組蛋白、染色質能否被打開還是收束等，與現存的預測工具相比，預測的結果最接近實際上的觀察值，達到了「更廣、更深、更強 (Latus, Profundus, Fortius)」（容我改一下奧運愛用拉丁文 Citius, Altius, Fortius），套句現在流行的話，就是可以克服取捨之間的困境，說出「小孩子才做選擇，大人我全都要」。

鉅亨網上聲稱「過去的基因預測模型往往只能專注於單一的生物過程，但 AlphaGenome 成功構建了一個統一的預測框架」，我覺得又講得太滿。同樣是 Google 旗下，但屬於不同子公司的 Calico Life Sciences LLC 開發出的 Borzoi 就可以處理轉錄資料 (e.g., CAGE, PRO-cap), 剪裁資料 (e.g., splice site, site usage, splice junction) 與 DNA 可及性資料 (e.g., DNase-seq, ATAC-seq)，而其實也是 DeepMind 做的 Enformer，也可以從 DNA 可及性、染色質構型與轉錄因子結合位來進行 variant effect 預測。科學沒有什麼一蹴可幾，迭代而已。

再仔細看 AlphaGenome 和其他模型的表現差異，在剪接上與 Pangolin 差約 3 個百分點，其他模型 3-5%。以它的廣度與深度兼俱來說沒有問題，至於強度（預測能力）的話，是否可以達到八成以上的預測能力，還有待後續。有些誇大的媒體聲稱「能讀懂讓科學家一頭霧水的 98% DNA」，實在太過。目前要這些佔了 98% DNA 的 non-coding region 還是需要實驗證實，預測模型可以讓我們在實驗中更有機會釐清機轉，而無法完全取代過程。過當的簡化讓人對於當前技術有虛妄的認知，雖然不可取，樂觀一點想，這也不失為一種能鑑別個體識讀能力與科學技術掌握度的線索。

AlphaGenome 的邏輯流程

AlphaGenome 的輸入、處理與輸出流程參見左圖 (a)

輸入 (input) : 輸入最多 1 Mb 的 DNA 序列，並進行序列切分 (sequence partitioning) 以進行平行運算 (sequence parallelism)，產出許多條大約 131 kb 的基因片段（genome tracks）。
加密-轉換-解密 (細節參見文中附圖1)
1. 加密 (encoder)：利用卷積神經網絡（Convolutional Neural Network, CNN）的卷積層 (convolutional blocks) 提取局部訊息，再用 U-Net-style design 來兩倍兩倍壓縮資訊量直至 2 的 7 次方，解析度到 128 bp，再丟到轉換塔 (Transformer tower)。
2. 轉換塔 (Transformer tower)：以 128 bp 解析度來進行成對比較，並進行層常規化 (layer normalization)、按行注意力計算 (Row-wise attention) ，再送到多層感知器 (Multi-Layer Perceptron, MLP)，而這也正是 AlphaFold 所使用的運算法。
3. 解密 (decoder)：再次使用 CNN 並解壓縮至 1 bp 解析度。
輸出 (output)：依生物學上基因表現的過程輸出 (task-specific output)。

在機器學習的訓練過程中，輸入經過交插驗證的基因折 (fold)，方便進行機器學習。在訓練前期 (pretraining process)，先丟入部份基因折 (fold split) ，並產生出特定基因折 (fold-specific) 與具有所有基因折 (all-fold) 的教師模型 (teacher model)。

在蒸餾階段 (distillation process)，再由教師模型用全折 (all-hold) 訓練學生模型 (student model) ，而輸入的序列更包括變異的序列，讓模型可以了解正常基因表現與變異之下會有的影響。

之後會再 AlphaGenome 在不同基因表現步驟的預測性，以及血液學 T-ALL 基因表現變異的實測。

狐狸血液學 Fox Hematology 🦊🩸

Discussion about this post

Ready for more?