因果推斷(Causal Inference)概要

2022-09-08 21:39:21 字數 1779 閱讀 4212

(隨便配的圖,其實佛教的因果和我們這裡的因果還不太一樣的。。。)

這裡簡單談一下因果學習相關的一些最為基礎的東西。

首先,所謂因果性與相關性不同,相關性指的是如果我們觀測到了乙個變數x的分布,就能推斷出另乙個變數y的分布的話,那麼說明x和y是有相關性的。而因果性則強調,如果我們操作了某個變數x,而這種操作(manipulate)引起了y變數的變化的話,那麼我們才能說明x是y的cause,而y是x的effect,這是因果學習的基本出發點,我們要找的是這樣的因果關係,而不是簡單的相關關係。

因果性與相關性的不同,舉乙個簡單的栗子:比如我們可以通過統計資料發現,乙個學校的學生的成績和其是否戴眼鏡有很強的正相關的關係。相關性可以用這樣的統計資料直接看出來,但是因果性還沒有確定。人們如果誤將相關性的變數認為成了因果性的變數的話,就會通過給學生戴上眼鏡的方式來提高他們的成績。這是很荒謬的,原因就在於這是乙個manipulate,這種manipulate需要的是因果性,而不是簡單的統計相關性。我們根據經驗知道,成績好和戴眼鏡背後都有乙個common cause,那就是讀書時間長。類似的錯誤並不少見,再舉乙個日常的例子,這個栗子相對於前面的例子可能有些不太明顯:有人發現喝名貴葡萄酒的人壽命更長,所以提出通過每天飲用一點這種葡萄酒來養生。這個操作和前面說的戴眼鏡的操作比起來,看上去似乎合理的多,現實中也確實是很多人覺得適量飲酒可以養生。但是這個仍然是乙個沒有區分相關和因果的情況。在這種情況下,經常喝名酒與壽命長也有共同的原因:那就是這個人很可能社會階層較高,生活較為富足,因此能經常喝紅酒,並且可以享受最好的醫療條件。這樣看來,因果性有時候在做判斷和決策的意義上可能比統計相關性更加有意義。

如果要按照定義來找因果關係,那麼應該通過做實驗,控制變數,改變某乙個變數x,然後觀察另乙個變數y是否跟著改變。但是實際上很多情況下我們只有大量的統計資料,而非實驗結果,而且,有些情景我們也無法做實驗,比如有違反科學倫理的內容,或者由於客觀條件不可能開展實驗的,比如巨集觀經濟現象我們就無法通過實驗來證明,只能通過已有的資料來進行分析。那麼,如何從各個變數的資料集中找到他們的因果關係,就是因果推斷的基本內容。

因果推斷實際上是學習乙個(graph),就是圖論裡的那個圖。變數作為頂點vertices,是否有因果關係為邊edge,這是乙個無環圖,但是也沒有方向。換句話說,我們知道a和b有因果關係,但是究竟是a導致b還是b導致a,我們不知道。這樣組成的因果網路一般叫做乙個markovian equivalence,也就是馬爾科夫等價。既然是等價,也就說明這個無向圖加上方向後的這些有向無環圖(dag)都是markov等價的。

對圖的結構,或者說骨架的學習,得到乙個無向圖。然後在對每條邊確定方向。最終,我們得到的dag,就可以表示這些變數之間的因果關係。這就是因果推斷的基本流程。

在因果推斷中,也有數學模型來表示因果關係。比如anm模型,就是加性噪音模型,它把原因x和結果y建模成:y=

f(x)

+ny=

f(x)

+nx=

g(y)

+n′x

=g(y

)+n′

來表示兩者關係,那麼y和n』就不如x和n那麼獨立。這就產生了乙個不等性質。利用這個不等性質,就可以通過各種手段把方向確定下來。

對於實際資料,通常分成continuous和discrete來研究。對不同的資料型別,也有不同的方法被提出。

後面的幾篇主要集中在anm模型相關,以及離散資料型別的causal inference。

2023年03月12日22:41:50

因果推斷 去混雜

混雜可以簡單地定義為導致p y x p y do x 即兩個概率出現差異的所有因素。為了去除x和y中的混雜,我們只需要阻斷它們之間的每個非因果路徑,而不去阻斷或干擾所有的因果路徑就可以了。更確切地說,我們將後門路徑 back door path 定義為所有x和y之間以指向x的箭頭為開始的路徑 如果我...

因果推斷 因果關係之梯

關聯 第一層級 通過觀察尋找規律。如果觀察到某一事件改變了觀察到另一事件的可能性,我們便說這一事件與另一事件相關聯。基於被動觀察做出 典型問題是 如果我觀察到 會怎樣?當今的人工智慧仍處於第一層級,強人工智慧的目標是製造出擁有人類智慧型的機器,讓它們能與人類交流並指導人類的探索方向。而深度學習只是讓...

人 波,顛倒因果

曾經物理老師,一次物理課上講到物理科學時,提到 人說不定也是以一種波的形式存在,當你觀察的時候就以實物的形式存在,當你不觀察的時候就以波的形式存在,因為每當我們閉上眼睛根本不知道周圍真正發生了什麼。大學階段有幸接觸到了雙縫干涉實驗,又受一篇已發表的文章的啟示,終於算是解決了這個埋藏已久的問題。雙縫干...