1.異常值就是遠離集中趨勢的值,異常值有可能是採集和處理資料過程中的錯誤導致的,也有可能是罕見的正確結果。
2.概率質量函式(probabilitymass function,pmf):以函式的形式表示分布,該函式將值對映到概率。如果要處理的比較少,pmf很合適;但隨著資料的增加,每個值的概率就會降低,而隨機雜訊的影響就會增大。
3.相對風險(relativerisk)兩個概率的桌布,通常用於衡量兩個分布的差異。
4.貝葉斯事件。貝葉斯定理通常用於解釋某一特定現象的證據e如何影響假設h的概率。
在看到e之後h的概率,等於看到該證據前h的概率,乘以假設h為真的情況下看到該證據的概率與在任何情況下看到該證據的概率的比值。為先驗概率,而為後驗概率,是證據的似然值,是歸一化常量。
5.相關係數可以衡量兩個變數之間線性相關的強度和正負,但是無法知道它們的斜率。有很多方法可以用來估計斜率,其中線性最小二乘擬合是最常用的一種方法。線性擬合指的是用乙個線性的方程來擬合兩個變數之間的關係。最小二乘法是使擬合函式與資料之間的均方誤差達到最小的擬合方法。
1962 統計數字(思維)
time limit 1 sec memory limit 128 mb submit 217 solved 100 submit status web board 某次科研調查時得到了n個自然數,每個數均不超過1500000000 1.5 109 已知不相同的數不超過10000個,現在需要統計這些...
python與醫學統計 醫學統計思維 資料庫
資料分析是統計中最常用的技能,但是資料從何而來,許多是根據乙個想法臨時收集,這個想法 可能是仙人指路,也可能是自己閱讀文獻或是臨床實踐的靈光一閃,又或者是突發奇想,然後想驗證一下。無論哪一種,都是正向思維,由想法到資料收集,但許多人是沒有仙人指路的,也沒有大量閱讀文獻的技能與習慣,也缺乏敏銳的洞察力...
統計思維 程式設計師數學之概率統計(1)
第一章 經驗之談 觀察的數量太少 選擇偏差 確認偏差 不準確 更好的做法 統計方法 收集資料,使用大型全國性調查的資料 描述性統計,計算能總結資料的統計量 探索性資料分析,尋找模式 差異和其他能解決問題的而特徵 假設檢驗,評判影響是否真實 估計,樣本推斷整體 術語 經驗之談 個人隨意收集的證據 直觀...