檢驗資料集是否服從正態分佈

2021-08-19 23:42:56 字數 1080 閱讀 4826

1.p-p圖

以樣本的累積頻率作為橫座標,以正太分布計算的響應累積概率作為縱座標,把樣本值表現為執教座標系中的散點。若資料集服從正太分布,則樣本點應圍繞第一象限的對角線分布。

1.2 qq圖

以樣本的分位數作為橫座標,以按照正太分布計算的相應分位點作為縱座標,把樣本表現為直角座標系的散點。若服從正太分布,則樣本點應該呈一條圍繞第一象限對角線的直角。

1.3直方圖(最直觀)

判斷方法:是否以鍾形分布,同事可以選擇輸出正態曲線

1.4箱式圖

判斷方法:觀測離群值和中位數

1.5莖葉圖

類似於直方圖,但實質不同

2.1偏度係數和峰度係數

是可以用來衡量資料集的分布形狀的係數。

偏度係數計算公式:(取值範圍通常再-3~3,衡量了資料集的對稱程度;0資料集對稱,負左側分散,正右側分散)

峰度係數(負說明資料集較集中,兩側資料集較少。為正則相反;偏度係數和峰度係數都為0,則該資料集服從標準的正態分佈):

偏度:

峰度:

2.2非引數檢驗方法

包括kolmogorov-smirnov檢驗(d檢驗)和shapiro-wilk(w檢驗)

檢驗樣本資料是否服從某一分布(Python3)

1.夏皮羅維爾克檢驗 shapiro wilk test 檢驗小樣本資料是否服從正態分佈 2.科爾莫戈羅夫檢驗 kolmogorov smirnov test 1 用於檢驗x的分布g x 是否服從給定分布f x 僅適用於連續分布的檢驗 2 檢驗兩組資料是否來自統一分布。3.安德森 達令檢驗 ande...

數學模型 正態分佈檢驗

概率密度分布曲線表示式為 f x 12 ex p x 2 2 2f x frac exp f x 2 1 exp 2 2 x 2 下面以房屋的評分系統資料作為說明,提取碼 lyhx import numpy as np import pandas as pd import matplotlib.py...

統計學之正態分佈檢驗

本次主要是對資料集資料進行正態分佈檢驗,資料集位址為 主要包括三列資料,體溫 f 性別 1 男,2 女 心率 次 分鐘 1.資料統計 usr bin env python coding utf 8 import requests import pandas as pd import numpy as...