2 theme y軸 單基因生信分析2下游分析

2021-10-14 22:46:33 字數 3232 閱讀 2726

前期小王子已經更過單基因生信分析--差異分析&生存分析,今天,小王子跟大家一起學習如何進行下游挖掘,也就是本期主打的單基因下游富集通路,以下以tcga資料庫中的lihc資料為例,跳躍的部分大家可以結合著前期推送一起看。

######整理基因表達資料######rm(list = ls())library(data.table)library(magrittr)expr 'tcga-lihc.htseq_fpkm.tsv.gz',h=t,check.names = f)ann 'gencode.v22.annotation.gene.probemap',h=t)expr2 1:library(limma)expr2 -1],id=expr2$gene) %>% expr3 as.data.frame(t(expr2))expr4 ###將基因按照首字母排列
相關性分析常用的有pearson相關係數和spearman相關係數,其中pearson相關係數適用於連續性變數,且變數服從正態分佈的情況,為引數性的相關係數;而spearman相關係數適用於連續性及分型別變數,為非引數性的相關係數。以下採用spearman相關。

######進行相關性分析######gene "a1bg"]) col data for (i in 1:length(col))
這裡的p值<0.05會有很多基因滿足,我們需要進一步根據篩選出來的基因個數來設定相關係數cor的閾值,這裡小王子設定成0.6,最終得到87個顯著相關基因進行下游分析。

######設定篩選條件,獲得最終的顯著相關基因######names(data) "gene",sig_data $pvalue%as.data.frame()go data$entrezid, orgdb = org.hs.eg.db, ont=kegg data$entrezid,organism =

五、go和kegg富集分析結果水平柱形圖的展示:由於go富集到了275條通路,這裡根據p.adjust選取前20條進行展示;而kegg一共富集到9條密切相關通路,這裡完全展示。

######繪製go水平柱狀圖######go1 $p.adjust)[1:20],] go1$p.adjust $p.adjust)go1$generatio $ontology==##將generation變為百分比,以便後續繪圖使用library(ggplot2)ggplot(go1,aes(description,count,fill=p.adjust))+  geom_bar(stat = "identity")+  coord_flip()+  scale_fill_gradient(low="blue",high="red")+  labs(x="",fill="-log10(adj.p)")+  ggtitle("top20 go enrichment of our genes")+  theme_bw()+  theme(axis.title = element_text(size = 16),        axis.text = element_text(size = 12),        legend.title = element_text(size = 12),        plot.title = element_text(size = 18,face = "bold",hjust = 0.5))#題目設定:face = "bold"加粗字型;hjust = 0.5位置居中##go1為輸入資料框,將description作x,count作y,繪圖後再利用coord_flip()進行x、y軸轉換,實現水平柱狀圖的繪製;##scale_fill_gradient(low="blue",high="red")設定漸變色(越紅p值越顯著);ggtitle("")設定題目;theme設定主題背景、字型等。

######繪製keg**平柱狀圖######kegg$p.adjust

六、go和kegg富集分析結果氣泡圖的展示:

######go氣泡圖######ggplot(go1,aes(generatio,reorder(description,generatio),color=p.adjust,size=count))+  geom_point(shape=19)+  scale_color_gradient(low = "green",high = "red")+#設定氣泡漸變色  scale_size_continuous(range = c(2,9))+ #設定氣泡大小範圍  labs(x="generatio(%)",y="",color="-log10(adj.p)",size="gene count")+  ggtitle("top20 go enrichment of our genes")+  theme_bw()+  theme(axis.title = element_text(size = 16),        axis.text = element_text(size = 12),        legend.title = element_text(size = 12),        plot.title = element_text(size = 18,face = "bold",hjust = 0.5))
最後幾張結果展示部分,kegg結果不太美觀,當然與我們選取的基因有很大關係,不過你也可以設定篩選條件時選擇cor=0.5作為閾值,會篩選出657個顯著相關基因,或許結果又不一樣了呢?多嘗試幾次,總有理想結果。或許還有人有這樣的疑惑:正相關和負相關的基因能否放一起進行富集分析呢?這裡小王子收集到的資料採用放在一起分析,對映到差異分析上調和下調放一起富集分析或許大家更好理解一些。

參考: 1.r-視覺化基礎(4)—— go/kegg柱狀&氣泡圖--《醫學僧的科研日記》

Crazyflie微型四軸 深入解讀2

一.微處理器部分 處理的核心,可以看到四個motor驅動控制腿,狀態指示燈,21 22腿的iic介面,與imu模組通訊,2 3 4 11 12等引腳的對電源管理模組的控制,主要功能就是檢測電壓,控制通 斷等,25到31對2.4g無線模組的通訊與控制 14到17引腳作為預留外設介面 44腳為引導程式位...

2 單例模式

一 簡介 什麼是單例模式?單例模式是指 保證乙個類僅有乙個例項,並提供乙個訪問它的全域性訪問點。單例模式實現一 使用類方法實現 class singleton object instance none classmethod definstance cls if cls.instance retur...

2 單檔案元件

閱讀 vue cli 3 的官方文件 vue create my components將之前的 my button 元件單獨做乙個檔案並放入 my components src components 資料夾中 將預設的helloworld修改為my button 使用 npm 指令碼執行 vue c...