1.p-p圖
以樣本的累積頻率作為橫座標,以正太分布計算的響應累積概率作為縱座標,把樣本值表現為執教座標系中的散點。若資料集服從正太分布,則樣本點應圍繞第一象限的對角線分布。
1.2 qq圖
以樣本的分位數作為橫座標,以按照正太分布計算的相應分位點作為縱座標,把樣本表現為直角座標系的散點。若服從正太分布,則樣本點應該呈一條圍繞第一象限對角線的直角。
1.3直方圖(最直觀)
判斷方法:是否以鍾形分布,同事可以選擇輸出正態曲線
1.4箱式圖
判斷方法:觀測離群值和中位數
1.5莖葉圖
類似於直方圖,但實質不同
2.1偏度係數和峰度係數
是可以用來衡量資料集的分布形狀的係數。
偏度係數計算公式:(取值範圍通常再-3~3,衡量了資料集的對稱程度;0資料集對稱,負左側分散,正右側分散)
峰度係數(負說明資料集較集中,兩側資料集較少。為正則相反;偏度係數和峰度係數都為0,則該資料集服從標準的正態分佈):
偏度:
峰度:
2.2非引數檢驗方法
包括kolmogorov-smirnov檢驗(d檢驗)和shapiro-wilk(w檢驗)
檢驗樣本資料是否服從某一分布(Python3)
1.夏皮羅維爾克檢驗 shapiro wilk test 檢驗小樣本資料是否服從正態分佈 2.科爾莫戈羅夫檢驗 kolmogorov smirnov test 1 用於檢驗x的分布g x 是否服從給定分布f x 僅適用於連續分布的檢驗 2 檢驗兩組資料是否來自統一分布。3.安德森 達令檢驗 ande...
數學模型 正態分佈檢驗
概率密度分布曲線表示式為 f x 12 ex p x 2 2 2f x frac exp f x 2 1 exp 2 2 x 2 下面以房屋的評分系統資料作為說明,提取碼 lyhx import numpy as np import pandas as pd import matplotlib.py...
統計學之正態分佈檢驗
本次主要是對資料集資料進行正態分佈檢驗,資料集位址為 主要包括三列資料,體溫 f 性別 1 男,2 女 心率 次 分鐘 1.資料統計 usr bin env python coding utf 8 import requests import pandas as pd import numpy as...