隨機實驗(精通計量)

2021-10-09 14:28:38 字數 605 閱讀 3649

擁有醫療保險的人與沒有醫療保險的人直接比較

組間均值之差 = 平均因果效應 + 選擇偏誤

大數定律:隨著樣本規模不斷增加,樣本均值接近總體均值(數學期望)

樣本規模足夠大(大數定律)時,隨機試驗可以讓選擇偏誤消失(確保被比較的個體所形成的組是類似的)

平衡性檢查

為了讓樣本均值接近期望,如何決定抽取樣本的多少(統計精度)?

對抽樣中存在的不確定性進行量化

偏誤:

引數:總體的乙個固定特徵(如數學期望)

樣本統計量:像樣本均值這樣隨樣本不同而不同的量

估計量(estimator):用來估計引數的樣本資料的函式

無偏估計量:樣本統計量的期望等於相應的總體引數

變異性:

樣本方差 / 總體方差 / 抽樣方差

中心極限定理:當樣本規模足夠大時,抽樣分布接近於標準正態分佈

reference

angrist, j. d., & pischke, j. (n.d.). mastering metrics: the path from cause to effect.

偽隨機與實驗

眾所周知,計算機產生的是偽隨機數。所謂偽隨機,就是 當知道種子和隨機產生演算法之後,就可以完全確定出隨機數序列了。並且這個隨機數序列是迴圈重複的。不同的隨機產生演算法的迴圈週期不同 好的隨機產生演算法的迴圈週期會很長。有的文章提到,可以通過引入系統以外的變數來達到真隨機的目的,比如 unix 維護了...

實驗物件隨機分組程式

老師上統計課的時候講了實驗室對實驗小鼠進行隨機分組的方法。方法有點麻煩,如下 0.n為總數,m為組數,o為每個小組的最大數量,o n m 1.對每個小鼠進行編號 2.依次對每個小鼠取隨機數,並把這個隨機數除以組數求餘,餘數為初次分配的組數 3.對多於數量o的小組,取隨機數求餘的方式隨機確定乙個成員,...

隨機數模擬拋硬幣實驗

在現實計算機上無法產生真正的隨機數,因此在隨機化演算法中使用的隨機數都是一定程度上隨機的,即偽隨機數。線性同餘法是產生偽隨機數最常用的方法 這裡不介紹 下面用計算機產生大的偽隨機數來模擬拋硬幣試驗。假設拋10次硬幣,每次拋硬幣得到正面和反面是隨機的。拋10次硬幣構成乙個事件。呼叫random 2 返...