-
蛋白質組學開年第一彈——人工智能助力于空間蛋白質組學
發布時間: 2025-02-28 點擊次數: 58次PLATO——探索空間蛋白質組學的變革性平臺。
中國科學院動物研究所趙方慶、冀培豐團隊共同合作,融合人工智能算法、微流控和空間蛋白質組學等技術,并提出人工智能驅動的空間蛋白組學分析技術框架——跨組學數據的并行流投影和遷移學習(PLATO, parallel-flow projection and transfer learning across omics data)。這一成果于2025年1月23日在線發表在《cell》雜志。
圖1. 人工智能驅動的空間蛋白組學分析技術框架——PLATO。
文章亮點
? PLATO可以實現跨整個組織的高分辨率空間蛋白質組學
? 使用質譜法和微流體技術對數千種蛋白質進行空間分析
? 多種組織兼容,從模式生物到人類樣本
? 識別人類乳腺癌中不同的腫瘤亞型和失調蛋白
技術簡介——PLATO框架
PLATO工作流程主要包括平行數據采集和基于人工智能算法的數據分析(圖2)。首先進行三個連續的冷凍組織切片開始:中間切片用于通過組織學染色或空間組學(例如,空間轉錄組學)生成參考組學數據,而第一個和最后一個切片在不同角度進行基于微流體的蛋白質組學分析。每個切片被平行微通道覆蓋,在片上消化后,肽被收集用于LC-MS/MS分析。這些測量被稱為平行流投影,類似于基于射線的斷層掃描。
為了重建蛋白質的空間分布,研究者開發了Flow2Spatial,這是一種遷移學習算法,利用參考組學數據來訓練深度學習模型,用于從平行流預測中預測蛋白質分布。Flow2Spatial并不僅僅依賴于mRNA-蛋白的相關性,而是利用聚類特征和正交投影來推斷空間蛋白質模式。
圖2. PLATO框架的設計與實驗驗證
基于PLATO框架的研究成果
小鼠小腦空間蛋白質組學圖譜
研究者收集了236個組織體素(~100×100×10μm)用于基于激光捕獲顯微解剖(LCM)的空間蛋白質組學(圖3)。除去異常值后,LC-MS/MS分析平均得到1849個蛋白質組。比較PLATO和LCM之間的空間蛋白質組時,觀察到大腦區域之間有很強的Spearman相關性:分子層(0.89)、顆粒層(0.87)、纖維束(0.82)和側隱窩(0.74)。這些相關性與同一地區LCM樣本中觀察到的基線Spearman系數0.80密切匹配。值得注意的是,區域邊界(分子層和顆粒層:0.89,顆粒層和纖維束:0.86)也保持了很高的相關性。20個區域富集蛋白的IF染色證實了它們的空間分布與Flow2Spatial重建結果緊密一致。PLATO與相應的LCM樣本表現出高表達相關性,確證了Flow2Spatial重建的準確性,這表明PLATO可靠地繪制了蛋白質的解剖位置,具有很高的準確性。
圖3. 基于PLATO框架的小鼠小腦空間蛋白質組學圖譜。
基于PLATO框架的人乳腺癌空間蛋白質組學圖譜
研究者繪制了一位77歲女性乳腺癌患者的新鮮冷凍乳腺癌樣本的空間蛋白質組圖譜(圖4),該患者被診斷為HER2+、ER 70%、PR?。PLATO使用具有70個平行通道的微流控芯片,每個通道寬25 μm,從兩個角度識別每個通道約4,000個蛋白質基團。聚類分析顯示三個不同的空間聚類:兩個腫瘤區域和一個相鄰區域,與病理學注釋很好地對齊。LCM -蛋白質組分析,收集了145個組織體素(~100×100×10μm)。在腫瘤區域平均每體素發現3500個蛋白,明顯多于相鄰區域。在所有區域(腫瘤1:0.82,腫瘤2:0.85,鄰近:0.81),PLATO和LCM結果之間觀察到高度的Spearman相關性,并且在區域邊界(鄰近和腫瘤1:0.80,鄰近和腫瘤2:0.81)發現類似的強相關性。像素級的比較進一步證實了PLATO的準確性,IF染色也驗證了PLATO中四個代表性蛋白的空間分布。研究發現兩種腫瘤亞型:腫瘤1 (HER2+, ER?,PR?)和腫瘤2 (HER2+, ER+, PR?)。通過LCM-蛋白質組分析顯示出比臨床診斷(HER2+, ER 70%, PR?)更高的準確性,因為PLATO顯示70%的ER表達是兩種亞型的復合。此外,與PAM50亞型相關的蛋白在腫瘤1和腫瘤2之間存在差異表達,證實了它們的不同特征。PLATO重建ERBB2提供了比LCM結果更全面的視圖,提示腫瘤內潛在的異質性。腫瘤1富含細胞外基質(ECM)蛋白,如纖維蛋白-5 (FBLN5)、絲蛋白- a (FLNA)、纖維連接蛋白(FN1)、彈性蛋白(ELN)和LAD1,表明腫瘤表型更具侵襲性。相比之下,腫瘤2富含激素信號相關蛋白,如雌激素受體1 (ESR1)(乳腺癌的臨床生物標志物)和粘蛋白1 (MUC1)(穩定和激活雌激素受體),突出了其特別的生物學和與雌激素信號傳導的關系。
圖4. 基于PLATO框架的人乳腺癌空間蛋白質組學圖譜。
總結
盡管基于成像和抗體的方法最近取得了進展,但在空間蛋白質組學中,實現整個組織的深度、高分辨率蛋白質圖譜仍然是一個重大挑戰。PLATO,一個將微流體與深度學習相結合的集成框架,可以在整個組織切片中實現數千種蛋白質的高分辨率映射。我們通過PLATO框架分析小鼠小腦的空間蛋白質組,在一次運行中鑒定了小鼠小腦2564個蛋白質組。將PLATO應用于大鼠絨毛和人類乳腺癌樣本,實現了25μm的空間分辨率,并揭示了與疾病狀態相關的蛋白質組動力學。該方法揭示了空間上不同的腫瘤亞型,鑒定了關鍵的失調蛋白,并為腫瘤微環境的復雜性提供了新的見解。