Cox比例風險回歸模型單因素多因素生存分析

2021-10-03 20:12:44 字數 3197 閱讀 4539

cox比例風險回歸模型臨床應用非常廣泛,cox分析得到的結果是可以直接運用到臨床應用的,所以這個分析對癌症臨床診斷有非常關鍵的作用,檢測高低風險的關鍵基因,就可以**病人5年生存率。

cox比例風險回歸模型,簡稱cox回歸模型。該模型又英國統計學家d.r.cox於2023年提出,主要用於腫瘤和其他慢性病的預後分析,也可用於佇列研究的**探索。cox回歸模型能處理多個因素對生存時間影響的問題。

這裡用到的癌症是:宮頸鱗狀細胞癌cesc(臨床307個樣本,基因表達有304個樣本)

首先需要合併差異基因得到的表達量和臨床資訊

有了生存時間和表達量合併的檔案,就可以做單因素cox分析,直接用我們的r做分析,得到這樣乙個**檔案。

cox單因素分析得到了單個基因的風險比和p值,可以篩選p值乙個標準的基因,拿到這些基因,然後把這些基因的表達量篩選出來,還有樣本的生存時間和生存狀態,放在乙個檔案裡面,用來做這些基因的多因素分析,當然了,篩選的基因不要多,控制在20個左右。簡單點說,就是篩選這20個左右基因如同步驟一的檔案。

利用上面得到的關鍵基因的表達量做多因素分析,方法和單因素的差不多,只是這時用到了所有基因,而單因素是對每個基因做分析,多因素是用這些關鍵基因一起分析。可以得到風險值和高低風險分類。

用到的都是上面多因素分析得到的資料,用所有樣本的風險比例,生存時間,就可以做生存曲線,roc曲線。

這裡需要用到兩個資料,乙個是cox多因素分析得到的基因,這個是根據cox公式計算得到的,這裡我們得到了7個,提取這7個基因的表達量,還有這7個基因在高低風險的分類,就可以繪製一張熱圖,熱圖從左到右的樣本是風險分值以此從低到高的。

r語言例項練習:

單因素回歸分析:

library("survival")

#install.packages('survminer')

library("survminer")

data("lung")

#surv()函式建立生存資料物件(主要輸入生存時間和狀態邏輯值),再用survfit()函式對生存資料物件擬合生存函式

#surv:用於建立生存資料物件

#survfit:建立km生存曲線或是cox調整生存曲線

fit

#survdiff:用於不同組的統計檢驗

survdiff(surv(time, status) ~ ***, data = lung)

#三種作圖方法:

plot(fit)

ggsurvplot(fit,

pval = true, conf.int = true,

risk.table = true, # add risk table

risk.table.col = "strata", # change risk table color by groups

linetype = "strata", # change line type by groups

surv.median.line = "hv", # specify median survival

ggtheme = theme_bw(), # change ggplot2 theme

palette = c("#e7b800", "#2e9fdf")

)plot(fit,xlab="time(days)",ylab="survival",main="title",col=c("blue","red"),lty=2,lwd=2)

legend("topright",c("a","b"),col=c("blue","red"),lty=2,lwd=2,cex=0.7)

第乙個作圖語句輸出:

cox回歸分析:

library("survival")

library("survminer")

#cox模型主要用到的是coxph()函式,但需要先用surv()函式產生乙個生存物件;

#另外coxph()函式支援的方法有:exact,breslow以及exact,預設是exact

data("lung")

# res.cox

# summary(res.cox)

#coef就是公式中的回歸係數b(有時也叫做beta值)

#因此exp(coef)則是cox模型中最主要的概念風險比(hr-hazard ratio)

# hr = 1: no effect

# hr < 1: reduction in the hazard

# hr > 1: increase in hazard

# 在癌症研究中:

# hazard ratio > 1 is called bad prognostic factor

# hazard ratio < 1 is called good prognostic factor

res.cox

summary(res.cox)

# create the new data

***_df

data.frame(*** = c(1, 2),

age = rep(mean(age, na.rm = true), 2),

ph.ecog = c(1, 1)

))fit

ggsurvplot(fit, data = ***_df, conf.int = true,

legend.labs=c("***=1", "***=2"),

ggtheme = theme_minimal())

r語言 svycoxph R語言之cox回歸分析

cox比例風險模型 cox proportional hazards model,也稱為cox回歸 主要用於帶有時間的生存結局的影響因素研究,或評價某個臨床 措施對患者生存的影響。cox模型可以由hazard function表示,h t 簡單的說就是t時刻死亡的風險,公式如下 h t h0 t e...

r語言 svycoxph R語言之cox回歸分析

cox比例風險模型 cox proportional hazards model,也稱為cox回歸 主要用於帶有時間的生存結局的影響因素研究,或評價某個臨床 措施對患者生存的影響。cox模型可以由hazard function表示,h t 簡單的說就是t時刻死亡的風險,公式如下 h t h0 t e...

回歸的風險

回歸的風險 陳能技2007 10 11 原文 the risk of regression alan s.koch 但是,它僅僅是乙個很小很小的改動!我們怎麼會預先想到它會造成這麼大的問題?怎麼會,確實!回歸 向後追溯 是軟體系統的現實生活。即使之前是很好地工作的,但是不能確保它會在最近的 很小 的...