知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > 腫瘤免疫 >

TCGA數據庫腫瘤免疫全景圖

時間:2019-06-09 08:27來源:生信自學網 作者:樂偉 點擊:
2019注定腫瘤免疫年,做生信挖掘的,都知道今年的熱點非他莫屬,那么你知道當前有哪些分析熱點呢?哪些是發文經典內容經典套路呢,生信自學網教你看腫瘤免疫。
關注微信公眾號:biowolf_cn,回復“2019腫瘤免疫”,獲取本文文獻及其他腫瘤免疫參考文獻
2019注定腫瘤免疫年,做生信挖掘的,都知道今年的熱點非他莫屬,那么你知道當前有哪些分析熱點呢?哪些是發文經典內容經典套路呢,生信自學網教你看腫瘤免疫。
生信自學網腫瘤免疫推出的研究課程:

TCGA腫瘤免疫細胞浸潤模式挖掘
GEO數據庫免疫細胞浸潤視頻
甲基化免疫細胞浸潤模式
TCGA數據庫腫瘤微環境
TCGA數據庫腫瘤突變負荷

免疫微環境在腫瘤發生、侵襲、轉移及治療耐受過程中占據重要位置,預示著我們可以從免疫微環境參與腫瘤治療耐受的這一視角出發,為尋找新的抗腫瘤途徑開辟新的思路,下面我們就一起來嘗試了解這篇癌癥免疫圖譜文章吧。
2018年4月Immunity雜志上發表了文章The Immune Landscape of Cancer ,由34個單位共同合作完成。文章對TCGA中33種癌癥,超過10,000個腫瘤樣本進行了免疫原性分析,將所有腫瘤分成6種免疫亞型,即:
wound healing, IFN-γ dominant, inflammatory, lymphocyte depleted, immunologically quiet, and TGF-β dominant
進一步分析:
不同亞型間巨噬細胞或淋巴細胞特征、Th1:Th2細胞比例、腫瘤異質性程度、非整倍性、新抗原負荷程度、細胞增殖、免疫調節基因的表達、預后等指標的差異。
與免疫相關的驅動突變
參與腫瘤免疫的細胞內和細胞間調控網絡(調控網絡包含轉錄、microRNA、拷貝數、表觀遺傳信息)
分析流程

step1. 下載TCGA平臺33種癌癥類型的6種分子平臺數據(mRNA、microRNA、外顯子測序數據;甲基化、拷貝數、蛋白質芯片數據)
step2. 為全部非血液類癌癥進行免疫表達特征(160種)評分,將TCGA全部腫瘤聚類成6種免疫亞型
step3. 根據DNA甲基化、mRNA和H&E圖像分析確定白細胞類型及比例(用于評估免疫浸潤細胞的組成)
step4. 生存分析評估免疫亞型與預后的關系
step5. 分別以TCGA腫瘤類型、TCGA定義的分子亞型、6種免疫亞型分組,比較新抗原、病毒RNA表達、T細胞受體(TCR)和B細胞受體(BCR)、免疫調節因子(IM)表達與調控等特征(評估影響免疫原性和免疫浸潤的因素間的關系)
免疫原性(immunogenicity):能引起機體產生免疫應答的物質
腫瘤浸潤免疫細胞包括:T cells, B cells, natural killer cells, macrophages, neutrophils, dendritic cells, mast cells, eosinophils, basophils等
step6. 鑒定與免疫浸潤相關的體細胞變異(包括pathway, 拷貝數變異,driver mutation)
step7. 評估性別與祖源是否對特定腫瘤類型的免疫反應有影響
step8. 鑒定控制腫瘤免疫應答的細胞內調控網絡、參與形成腫瘤免疫微環境(TME)的細胞外通訊網絡
癌癥的免疫亞型
計算160種免疫特征間的相關系數,聚類分析,得到5個核心模塊免疫表達特征(巨噬細胞 , 免疫浸潤淋巴細胞, TGF-β response , IFN-γ response, wound healing ) → 據此將TCGA中的非血液腫瘤聚成6種免疫亞型(C1-C6) → 6種免疫亞型中這5種免疫特征的分布情況。(圖1A)
6種免疫亞型中腫瘤樣本表現出的其它關鍵免疫特征(圖1B,C)
每種腫瘤類型中免疫亞型的組成情況,圖1D。

Figure 1. Immune Subtypes in Cancer
 
腫瘤免疫浸潤的組成
不同免疫亞型的主要免疫浸潤細胞分布,圖2A
白細胞比例(leukocyte fraction,LF)在不同免疫亞型間(圖1C)和不同腫瘤類型間(圖2B)存在差異。
腫瘤基質比例與白細胞比例的相關性在腫瘤類型中不同,圖2C顯示2種代表性的腫瘤。(該相關性在免疫亞型的差別見補充圖2B)
基質細胞:器官中的結締組織細胞,為器官中實質細胞提供支持和營養。
已知基質細胞和腫瘤細胞間的相互作用在腫瘤生長和進展中起主要作用。基質細胞可以提供腫瘤細胞可以生長的細胞外基質,調節細胞生長因子,還可能通過一氧化氮的產生限制T細胞增殖,從而阻礙免疫能力。
通過TCGA的H&E染色圖片分析估計出具有浸潤淋巴細胞的腫瘤區域的空間比例,按免疫亞型查看,發現C2亞型的淋巴細胞浸潤區比例最高,圖2D。
 
Figure 2. Composition of the Tumor Immune Infiltrate
 
腫瘤免疫反應與預后
6種免疫亞型OS生存分析(圖3A):C3預后最佳;C1,C2雖然免疫成分多,但預后并不好;C4,C6免疫特征混雜,預后最差。(PFI結果見補充圖3A)
計算5種免疫表達特征分數與OS的一致性指數,紅色代表高風險。按免疫亞型和腫瘤類型分組(圖3B),淋巴細胞特征與C1,C2的預后改善相關;5種特征中任何一個增加都會導致C3預后更差。
計算輔助T細胞(Th1,Th2,Th17)與OS的一致性指數,按免疫亞型分組(圖3C),Th17細胞的增加與多數亞型的預后改善相關。
輔助T細胞(T helper cells, Th),是一種T細胞(白細胞的一種),它的表面有抗原受體,可以識別抗原呈遞細胞的MHC-II 類分子呈獻的抗原片段。 輔助T細胞主要可區分為Th1 Th2 Th17 及 Thαβ等四種。
使用CoxPH建立免疫特征分數高低的生存模型,分數高低與生存顯著相關,圖3D是驗證集的KM-polt,圖3E顯示模型的預測準確度。圖3F說明添加腫瘤stage和tpye信息后模型預測更準確。
補充圖3E,F討論了其它免疫特征與OS的關系,某些腫瘤類型中免疫亞型與OS的關系

Figure 3. Immune Response and Prognostics
 
免疫反應與體細胞變異
6中免疫亞型的免疫浸潤(白細胞比例LF)與DNA損傷(包括CNV負荷、非整倍性、雜合性丟失LOH、同源重組缺陷HRD、腫瘤內異質性ITH)的相關系數熱圖,圖4A。發現LF與C6和C2的相關性最強,從整體來看與非整倍性、LOH、HRD及突變負荷成正相關。
圖B顯示平均LF值在1-22號染色體上的觀察值與預估值間的差異,左右圖分別為拷貝數擴增和缺失,黑色部分代表差異顯著。揭示了LF與拷貝數變異的相關性,如:chr1p擴增,LF高于預估值,缺失則LF低于預估值,據此進一步將該位置上的重要基因的CNV與免疫浸潤相聯系。
基因的平均LF預估值:每種腫瘤的平均IF的平均值由每種疾病類型中存在的“擴增/缺失”樣品的數量加權。
補充圖4探討了腫瘤內異質性ITH與預后、LF、免疫亞型間的關系。
將299個癌癥驅動基因的突變與免疫亞型相關聯,發現33個顯著相關的基因,圖C。
圖D為LF-驅動基因變異火山圖,x軸為基因變異與LF的多因素相關性(考慮了腫瘤類型和突變數量),y軸為顯著性,橙色即為與LF顯著相關的驅動基因變異。其中23個驅動基因變異與LF增加相關,12個與LF降低相關。
補充圖4C分析了體細胞變異(突變+CNVs)對8種癌信號通路的影響。

Figure 4. Immune Response and Genome State
 
人口統計學因素及遺傳變異與免疫反應
考察了不同腫瘤類型中免疫細胞與性別和祖源的相關性,圖4E。發現在某些腫瘤中,女性的PD-L1表達高于男性,非洲血統患者PD-L1表達較低。
免疫原性調查
文章中的免疫原性主要討論的是新抗原負荷,即SNV和Indel突變產生的預測能與pMHC結合并誘導免疫反應的肽。
MHC proteins(pMHC):指一些列細胞表面蛋白,主要作用是結合抗原并將其呈遞至細胞表面,使其被T-cell識別,即幫助免疫系統識別外來物質。
突變與pMHC:圖5A為與突變數量相關的pMHCs數量分布,標注了源于超過40個突變的pMHCs。99.8的pMHC由單突變產生,0.2%是由不同突變產生的相同pMHC。
常見pMHC:圖5B為y軸表達共有pMHC的腫瘤數,標注了產生最常見pMHC的已知癌基因(PIK3CA, KRAS, BRAF等)
補充圖5A,B討論了pMHC數與預后的關系:在多數腫瘤中pMHC數與生存無關,但在某些免疫亞型中,pMHC數與PFI預后相關。
補充圖5C討論了病毒與腫瘤中免疫特征的關系,病毒含量會影響免疫細胞的組成。
 
Figure 5. The Tumor-Immune Interface
 
癌癥中的適應性免疫受體庫
適應性免疫Adaptive immune:又稱獲得性免疫,對特定病原體具有高度特異性。獲得性免疫系統的細胞是T和B淋巴細胞。B細胞主要參與體液免疫,而T細胞則參與細胞免疫。B細胞和T細胞都攜帶能夠識別特定靶標的受體分子。
T細胞負責識別“非自身”靶標,如病原體,但需要一種被稱為主要組織相容性復合體(MHC)呈遞抗原之后才能實現。B細胞抗原特異性受體則是位于B細胞表面的抗體,負責識別病原體,不需要經過抗原呈遞。
免疫球蛋白immunoglobulin,又稱抗體,由適應性免疫系統的B細胞分泌。
根據RNA-seq數據評估TCR(T cell receptor)α和β、免疫球蛋白重鏈和輕鏈庫。
發現TCR多樣性值因免疫亞型而不同(圖5C),C6和C2的多樣性最高。(補充圖5D展示了不同腫瘤類型的TCR多樣性)
評估CDR3的α和β鏈,以確定具有相同TCR的患者頻率。圖5C為CDR3α-CDR3β pairs,顏色代表p值,圓的大小代表sample數目,至少在2種腫瘤中出現的α-β pairs有2812個。
檢驗SNV特異性pMHC-CDR3 pairs,圖5D展示了206個pMHC-CDR3α pairs和196個pMHC-CDR3β pairs。(說明這些患者中抗原受體多,抗原少,多數T細胞抗原反應是由公共抗原介導)
抗原受體通常由位于重鏈和輕鏈上的兩個可變結構域組成,每個可變結構域上有三個非連續排列的CDR(CDR1,CDR2和CDR3)
Complementarity-determining regions, CDR: 互補決定區,是免疫球蛋白(抗體)和T細胞受體中可變鏈的一部分,分別由B細胞和T細胞產生,與其特異性抗原結合。作為分子中變化最大的部分,CDR對淋巴細胞產生的抗原特異性的多樣性至關重要。
在某些腫瘤類型中,TCR多樣性與PFI改善相關,見補充圖5F。
免疫球蛋白重鏈和輕鏈的多樣性模式與TCR類似。
 
免疫調節劑的調控
免疫調節劑(Immunomodulators, IM)基因的情況可以反映癌細胞對腫瘤微環境(TME)的調節。
IM基因的表達在免疫亞型中不同(圖6A),圖6B為亞型間差異最大的基因EDNRB和CXCL10的表達值。
許多IM的甲基化程度與表達值負相關,即表觀遺傳沉默(圖6A),如圖6C的C3亞型中的CD40基因。
294個miRNA可能是IM基因的調節因子,補充圖6C。
拷貝數改變影響多個IM,并在免疫亞型中存在差異。C1,C2亞型中IM基因頻繁擴增和缺失,C3和C5中IM基因變異較少(圖6A)。KIR2DL3等基因在C5中明顯缺失,CD40等基因常在C1中發生擴增(圖6D)。
圖6A熱圖中的擴增/缺失頻率:obs是指特定亞型中IM基因擴增/缺失頻率,exp是指全部樣本中擴增/缺失頻率的差異,熱圖反映的是obs與exp的差異
 
Figure 6. Regulation of Immunomodulators
 
免疫反應的網絡調控
免疫應答由腫瘤細胞、免疫細胞、基質細胞中的細胞內分子網絡狀態和細胞外通訊網絡(包括細胞間直接互作、通過可溶性蛋白或細胞因子通訊)構成。
根據FANTOM5中記錄的信息獲得配體 - 受體,細胞 - 受體和細胞 - 配體對的網絡,圖A,B,C分別是提取的IFM-γ, TGF-β, T細胞的細胞外通訊子網絡網絡。展示了免疫亞型間的一些關聯,例如C2,C3中,CD4 T細胞、CD8 T細胞和NK細胞都與IFM-γ及CCL5的表達相關;C2,C3,C6中,多種細胞都與TGF-β的表達相關……
構建泛癌癥轉錄調控網絡,關聯基因組事件 - 轉錄調控因子 - 下游靶基因 - 免疫浸潤-預后 。使用Master Regulator(MR)和SYGNAL兩種互補的方法,產生了2個轉錄調控網絡:
圖D是Master Regulator(MR)-Pan-Immune網絡,26個MRs(橙色填充)代表基因表達與LF相關的hub,連接15個上游driver events(橙色環)。
SYGNAL-PamImmune網絡,包含了171個富集且與LF相關的的IMs,主要展示下游調控網絡(突變 - 轉錄因子 - miRNA間的聯系)。(圖7E展示部分SYGNAL-PamImmune網絡)
MRs網絡圖的構建過程:根據下游靶基因的表達變化,推斷影響蛋白質活性的轉錄因子,為MRs → 根據蛋白互作尋找與MRs相關的發生變異的蛋白cMRs(與LF的相關系數高的優先) → 尋找與cMRs相關的mutation和CNVs事件。
SYGNAL網絡構建過程:用高表達的基因作為input,得到具有轉錄因子和miRNA共調節的基因(bicluster) → 過濾篩選得到171個與免疫浸潤和免疫調節均顯著相關的biclusters→ 添加biclusters的轉錄因子和miRNA調控信息 → 整合這些調控關系,連接成網絡(網絡圖構建步驟比較復雜,大致應該是這個意思)
綜合2個調控網絡,MR及SYGNAL中有7個共享的TFs,調節27個IM基因,推斷AKAP9, HRAS, KRAS和PREX2基因突變影響IMs。
圖7E展示免疫亞型-IM基因表達調控-腫瘤類型間的關系,可以鑒定不同免疫亞型內的IM基因調控因子。例如,C1和C2中的IM基因共同受BCL5B, ETV7, IRF1, IRF2, IRF4, PRDM1, 和SPIB調控;C3中IM受KLF15 and miR-141-3p調控……
某些腫瘤中,bicluster的表達增加與預后相關,在KIRC, LGG, LUSC和READ中預后差,在SKCM中預后好。
 
Figure 7. Predicted Networks Modulating the Immune Response to Tumors
 
結果總結
文章利用TCGA數據構建了癌癥的免疫基因組學圖譜:
根據5種免疫表達特征將TCGA的腫瘤分為6種免疫亞型
通過多種方法評估腫瘤樣本中的免疫組成,包括:根據基因表達和甲基化數據估計免疫細胞組成、預測來自突變和HLA-typing的新抗原-MHC pairs、根據RNA測序數據評估BCR和TCR庫。
比較癌癥和免疫亞型的免疫組成
鑒定與腫瘤微環境相關的體細胞變異
構建影響腫瘤微環境的分子調控網絡及細胞間通訊網絡
聯系免疫特征與生存,OS和PFI在腫瘤間或一些腫瘤內的免疫亞型中存在差異
數據和結果的補充表格下載地址:https://gdc.cancer.gov/about-data/publications/panimmune
文章很清晰,做了pan-cancer的免疫亞型分類,然后把能用到的所有基因組指標和免疫指標都進行了分組比較。文章的數據量很大,用到的方法很多,方法介紹也寫得很詳細,需要時可以再詳細了解;補充表格的數據有很多信息可以直接拿來用,避免重復分析一次。
看完文獻套路,希望入門腫瘤免疫套路,可以學習生信自學網錄制的課程:

生信自學網腫瘤免疫推出的研究課程:
TCGA腫瘤免疫細胞浸潤模式挖掘
GEO數據庫免疫細胞浸潤視頻
甲基化免疫細胞浸潤模式
TCGA數據庫腫瘤微環境
TCGA數據庫腫瘤突變負荷

關注微信公眾號,回復“2019腫瘤免疫”,獲取本文文獻及其他腫瘤免疫參考文獻


責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
馬上與樂老師QQ聯系 生信自學連
BioWolf二維碼生成器
頂一下
(1)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
BioWolf騰訊課堂
推薦內容
秒殺活動
生物信息學在線培訓
三字竟