生存分析彭非 生存分析

2021-10-12 15:53:40 字數 1197 閱讀 7620

生存分析(英語:survival analysis)是指根據試驗或調查得到的資料對生物或人的生存時間進行分析和推斷,研究生存時間和結局與眾多影響因素間關係及其程度大小的方法,也稱生存率分析或存活率分析。

生存分析涉及有關疾病的癒合、死亡,或者器官的生長發育等時效性指標。

某些研究雖然與生存無關,但由於研究中隨訪資料常因失訪等原因造成某些資料觀察不完全,要用專門方法進行統計處理,這類方法起源於對壽命資料的統計分析,故也稱為生存分析。

關於生存函式(英語:survival function):st

prtt

t表示某個時間,t表示生存的時間(壽命),pr表示表示概率。生存函式就是壽命t大於t的概率。舉例來說,人群中壽命超過50(t)歲的人在所有人中的概率是多少,就是生存函式要描述的。假定t=0時,也就是壽命超過0的概率為1;t趨近於無窮大,生存概率為0,沒有人有永恆的生命[**請求]。如果不符合這些前提假定,則不適應survival analysis,而使用其他的方法。

由上可以推導:生存函式是乙個單調非增函式。t越大,s(t)值越小。

衍生函式:

lifetime distribution function f(t) = 1-s(t) = pr(t <= t)

概率密度函式:

f(t) = d(f(t))/dt 又叫event density,單位時間事件event(可以是死亡或者機器失效)的概率,是生存函式的導數。

f(t) 的性質:

f(t) 總是非負的(沒有人可以再生)。函式曲線下方面積(從0到無窮大積分)為1。

s(t) = d(s(t))/dt = -f(t)

危險函式hazard function λ(t) = f(t)/s(t) 危險函式引入分母s(t)。其物理意義是,如果t=50歲,λ(t)就是事件概率(死亡)除以50歲時的生存函式。因為年齡t越大,分母生存函式s(t)越小,假定死亡概率密度f(t)對任何年齡一樣(這個不是survival analysis的假設),那麼危險函式λ(t)值越大,預期存活時間短。綜合很多因素,賣人身保險的對年齡大的收費越來越高。嬰兒的死亡概率密度相對高一些,雖然分母生存函式s(t)大,λ(t)值還是略微偏高,交的人身保險費也略偏高。

相關書籍

彭非, 王傳. (2004). 生存分析. 中國人民大學出版社. isbn 7300059562

陳家鼎. (2005). 生存分析與可靠性. 北京大學出版社. isbn 9787301053720

外部鏈結

生存分析初探 怎麼看懂生存資料?

今天我們開始乙個新的主題 生存分析。什麼叫生存分析?為什麼要採用生存分析呢?前面我們一起學習的多重線性回歸和logistic回歸都主要是用來分析某個結果的影響因素,比如教育程度對收入的影響,或者,糖尿病發生與否的影響因素,這些方法主要是在靜態地分析某乙個特定的結果。可是,倘若我們不僅僅關心結果的發生...

Stata極簡生存分析

webuse drugtr,clear webuse use dataset from stata website stset,clear 上一行命令匯入進來的資料是 生存時間資料 會比最原始的資料多四列,這一行命令的目的是重置為原始資料,之所以這樣做,是為了顯示資料處理的全部過程 指定生存時間為s...

R語言教程 生存分析

生存分析處理 特定事件將要發生的時間。它也被稱為故障時間分析或分析死亡時間。例如,患有癌症的人將存活的天數或 機械系統將失敗的時間。命名為survival的r語言包用於進行生存分析。此包包含函式surv 它將輸入資料作為r語言公式,並在選擇的變數中建立乙個生存物件用於分析。然後我們使用函式survf...