did(difference-in-differences model)也叫雙重差分模型。
現在要修一條鐵路,鐵路是條線,所以必然會有穿過的城市和沒有被穿過的城市。記di=1 如果城市i被穿過,di=0 如果城市i沒有被穿過。
現在我們比較好奇鐵路修好以後,被鐵路穿過的城市是不是經濟增長更快了?我們該怎麼做呢?
一開始的想法是,我們把di=1的城市的gdp加總,減去di=0的城市的gdp加總,然後兩者一減,即e(yi|di=1)-e(yi|di=0),這樣我們就算出了兩類城市的gdp的平均之差。
這樣做不用說肯定有問題。萬一被鐵路穿過的城市在建鐵路之前gdp就高呢?為了解決這個問題,我們需要觀察到至少兩期,第一期是建鐵路之前,第二期是建鐵路之後。我們先把兩類城市的gdp做兩期之差,即:
這是第一次差分,經過這一步,我們實際上算出了每個城市gdp的增長(率,如果取log之後),也就是gdp的趨勢。完了之後,計算:
這是第二次差分。這一步就把兩類城市在修建鐵路之前和之後的gdp增長率的差異給算出來了,這就是我們要的處理效應,即修建鐵路之後對城市經濟的促進作用。這個東西你還可以換乙個寫法。記t=1 如果時間為建鐵路之後,t=0如果時間為建鐵路之前,那麼我們可以得到乙個表:
treated代表在某一期,某一類城市是不是建了鐵路。第零期肯定沒有建鐵路,第一期只有di=1的城市建了鐵路。所以treated=di*t。因此我們把方程寫成:
對時間差分,得到:
再次差分,取期望:
可見,gamma就是我們想要估計的處理效應。所以實際做的時候,可以直接跑。
這個式子的回歸,得到的交叉項的係數就是所要估計的處理效應。
用乙個圖表示就是:
所以看清楚了,這裡did最關鍵的假設是common trend,也就是兩個組別在不處理的情況下,y的趨勢是一樣的。那麼你會說了,鐵路穿過的城市可能本身gdp也高,而gdp高的城市按照理論gdp增長率可能更高可能更低,所以common trend的假設可能是不對的,那怎麼辦?如果這個問題存在,我們可以進一步假設在控制了某些外生變數之後,common trend是對的,比如上個問題,我們可以控制城市在t=0期的gdp level。當我們控制其他變數之後,自然不能直接減兩次了,我們需要用上面說的回歸式子,即run the following ols:
參考資料:
did雙重差分法 雙重差分方法使用中的問題列舉
如何客觀評估政策和制度績效,特別是定量考察新政策對經濟影響的動態因果檢驗成為經濟學界亟需解決的問題。20世紀80年代,國外經濟學界借鑑自然科學實驗效果檢驗方法,興起了一種專門評估政策效果的方法 雙重差分法 differences in differences method,簡稱did 由於did方法...
差分 差分陣列 樹狀差分
原陣列 ai94 759差分陣列 bi9 5 3 24差分陣列的字首和94 759顯然通過求字首和可以做到單點查詢 他高效的地方在於區間修改,比如我們對區間 2,4 每個元素加上5,我們只需在差分陣列 b2 5,b5 5,然後求字首和即可 原陣列 ai94 759差分陣列 bi 903 2 1 差分...
代數方程與差分方程模型
代數方程與差分方程模型 原創tianguiyuyu 發布於2018 05 29 23 13 18 閱讀數 1149 收藏 展開1 代數方程模型。所謂的代數方程模型就是有一邊變數表示未知量,代數方程,即由多項式組成的方程。有時也泛指由未知數的代數式所組成的方程,包括整式方程 分式方程和根式方程。例如 ...