知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > GEO >

GEO芯片分析思路探討

時間:2017-08-15 07:26來源:原創 作者:BioWolf 點擊:
利用R軟件及affy、limma、pheatmap、ggplot2等R軟件包進行數據挖掘及生物信息學分析。DAVID在線工具做GO功能分析,在GeneMANIA數據庫做進一步研究。
表達譜芯片分析非常常見,是非常簡單易學的分析方法,如果是放在兩年前,GEO芯片分析,那時非常熱門,隨著論文不斷被發表,可以研究的課題越來越少,深度廣大加大,這種熱度也慢慢退卻,但是這種研究方法是生物研究入門最佳研究思路。
以癌癥芯片為例
首先要從NCBI GEO數據庫下載癌癥芯片表達譜數據,對數據進行處理,接著做差異表達基因的篩選,利用R軟件及affy、limma、pheatmap、ggplot2等R軟件包,進行數據挖掘及生物信息學分析。對基因芯片表達譜數據進行過濾和標準化,獲取癌癥及癌旁組織的差異表達基因。選擇統計學檢驗后差異最為顯著的基因作為研究對象(篩選條件可以設定為:logFC>2,P<0.05)。
差異表達基因的功能富集分析,可以先應用DAVID數據庫對篩選的顯著差異基因進行分析。DAVID數據庫集合多種基因注釋數據庫信息,可對基因數據集進行分析和注釋。研究時主要應用DAVID數據庫的基因本體(geneontology,GO)模塊對差異表達基因進行系統分析。然后做KEGG富集通路分析,比較常見的是使用KOBAS3.0在線工具,做KEGG富集分析,得到KEGG富集通路圖,以及富集柱狀圖。
最后可以做差異表達基因的調控網絡分析,差異表達基因經DAVID數據庫注釋后,我們可以選擇與功能(如細胞膜結構)相關的差異基因。這個是基于細胞膜與腫瘤細胞的轉移與侵襲力高度相關的理論基礎,這里我們可以應用GeneMANIA數據庫對DAVID注釋與細胞膜結構相關的基因進行網絡結構分析,獲取基因之間的共定位、共表達、共蛋白結構域等方面的關系,研究這些基因的分子調控網絡之間的關系。
基因關系圖
網絡構建的時候,也可以使用String在線工具做蛋白互作網絡,然后用Cytoscape軟件對蛋白互作網絡可視化,得到網絡圖,用于報告分析。

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
馬上與樂老師QQ聯系 生信自學連
BioWolf二維碼生成器
頂一下
(9)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
BioWolf騰訊課堂
推薦內容
秒殺活動
生物信息學在線培訓
三字竟