第一章:
經驗之談:
觀察的數量太少、選擇偏差、確認偏差、不準確
更好的做法-統計方法:
收集資料,使用大型全國性調查的資料
描述性統計,計算能總結資料的統計量
探索性資料分析,尋找模式、差異和其他能解決問題的而特徵
假設檢驗,評判影響是否真實
估計,樣本推斷整體
術語:
經驗之談 個人隨意收集的證據
直觀效應 表示發生了某種有意思的事情的度量或匯**計量
人為 由於偏差、測量錯誤或其他錯誤導致的直觀效應
佇列 一組被調查者
橫斷面研究 收集群體在特定時間點的資料的研究
字段 資料庫中組成記錄的變數名稱
縱貫研究 跟蹤群體,隨著時間推移對同一組人反覆採集資料的研究
過取樣 為避免樣本量過少,而增加某個子群體代表的數量
總體 要研究的一組事物,通常是一群人
原始資料 未經或只經過很少的檢查 計算或解讀而採集和重編碼的值
重編碼 通過對原始資料進行計算或者其他邏輯處理得到的值
記錄 資料庫中關於乙個人或其他物件的資訊的集合
代表性 如果人群中的每個成員都有同等的機會進入樣本,那麼這個樣本就具有代表性
被調查者 參與調查的人
樣本 總體的乙個子集,用於收集資料
統計顯著 若乙個直觀效應不太可能是由隨機因素引起的,就i是統計顯著的
匯**計量 通過計算將乙個資料集歸結到乙個數字,而這個數字能表示資料的某些特點
表 資料庫中若干記錄的集合
《統計思維 程式設計師數學之概率統計》學習筆記
如果有乙個包含n個值的樣本x ix i xi 那麼它們的均值 mu 等於這些值總和除以值的數量 1 n ix i mu frac sum i n1 i xi 均值是為了描述集中趨勢,而方差則是描述分散情況。一組值的方差為 2 1n i xi 2 sigma 2 frac sum i x i mu 2...
讀書筆記 程式設計師的數學 概率統計
體會之前讀過程式設計師的數學 程式設計師的數學線性代數,這次就把程式設計師的數學 概率統計也看了。配上普林斯頓微積分讀本,算是把高數三件套都過了一遍。雖然說也上過一遍概率論,但又只剩下一些零碎的記憶了。這次看一遍這本概率統計,看看能不能撈回來一點。跟本科上課的教材相比,它的特點和之前寫過的這種數學入...
程式設計師的數學之線性代數(1)
綜述 線性代數的學習,比起計算方法,更重要的是掌握它的本質含義,這一點是非常重要的。矩陣不僅僅是數字排列而成的表而已,如果我們嘗試從空間的角度去理解矩陣,我們會發現,它的 意蘊 是非常豐富有趣的。其實,本質上來說,矩陣就是對映,在空間上的一種對映。舉個例子來闡述這個觀點 假設有乙個m n的矩陣a,在...