本文介紹統計模型和抽樣分布基本知識。
統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型;
模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離;
我們用大量實驗資料去驗證模型是否健壯。
實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究總體分布,例如生產了一批10萬個燈泡,想知道燈泡的平均使用時長,無法10萬個全測,可以隨機抽取300個來估計。
假設兩次抽樣均來自同一總體分布,p不顯著,抽取的兩個樣本可能來自同一分布;
假設兩次抽樣均來自不同總體分布,p顯著,抽取的兩個樣本可能來自不同分布;
通過多次隨機抽樣,p值比較樣本差異,可計算出p顯著和不顯著時的概率,進一步確定抽取的樣本量是否能反映總體。
征服統計學02 什麼是正態分佈?
本文簡單介紹正態分佈 正態分佈簡介 正態分佈關鍵引數 均值 標準差 正態分佈曲線如何繪製 正態分佈曲線現象解釋 reference 正態分佈 normal distribution 又名高斯分布 gaussian distribution 又因其曲線酷似鐘形,得名鐘形曲線。還是以上篇提到的測量身高為...
統計學 變數 資料 抽樣
變數值是變數的取值 變數的型別 1.1 分類變數 1.2 順序變數 1.3 數值型變數 另,根據其取值不同又可分為 離散型變數 連續型變數 資料處理 將資料用圖表等形式展現出來 資料分析 選擇適當的統計方法研究資料,並從資料中提取有用資訊進而得出結論,具體方法有描述統計和推斷統計。推斷統計 如何利用...
統計學 統計學基礎
五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...