1.夏皮羅維爾克檢驗(shapiro-wilk test)
檢驗小樣本資料是否服從正態分佈
2.科爾莫戈羅夫檢驗(kolmogorov-smirnov test)
1)用於檢驗x的分布g(x)是否服從給定分布f(x),僅適用於連續分布的檢驗;
2)檢驗兩組資料是否來自統一分布。
3.安德森-達令檢驗(anderson-darling test)
檢驗樣本資料是否來自特定分布,包括分布:'norm', 'expon', 'gumbel', 'extreme1' or 'logistic'.
4.lilliefors檢驗
檢驗樣本資料是否來自正態總體
5.基於偏度和峰度的檢驗,可用於檢驗樣本資料是否來自正態分佈(偏度=0,峰度=3),易受異常值影響,不能用於小樣本。
偏度檢驗:h0 : 樣本資料的偏度=0 h1
:樣本資料的偏度≠0
拒絕原假設則認為樣本資料不是來自正態總體,但不拒絕原假設不能說明樣本資料來自正態總體,只能說明資料對稱,只有在 確定對稱性是影響分布的形態的唯一因素時,偏度檢驗才適用。
峰度檢驗:h0 : 樣本資料的峰度=3 h1
:樣本資料的峰度≠3
拒絕原假設則認為樣本資料不是來自正態總體,但不拒絕原假設不能說明樣本資料來自正態總體,容易出錯不推薦使用。
雅克-貝拉檢驗(jarque-bera test):檢驗樣本是否來自正態分佈
檢驗資料集是否服從正態分佈
1.p p圖 以樣本的累積頻率作為橫座標,以正太分布計算的響應累積概率作為縱座標,把樣本值表現為執教座標系中的散點。若資料集服從正太分布,則樣本點應圍繞第一象限的對角線分布。1.2 qq圖 以樣本的分位數作為橫座標,以按照正太分布計算的相應分位點作為縱座標,把樣本表現為直角座標系的散點。若服從正太分...
機器學習樣本資料集,訓練正負樣本
1 caltech 101 資料庫 該資料庫在2003年被發布,包括101類目標影象和1類背景影象,共102類,彩色影象較多,有部分灰度影象。總共影象數為9145 除去背景後總數為8677 每類影象數大約在31 800之間,影象大小為300 200。此資料庫的特點是 每個影象只含有乙個目標,且目標大...
小樣本資料集介紹
本篇對小樣本學習常用資料集進行介紹,由於本人理解問題,可能還存在誤差。1 omniglot 相當於1623個類,每類20個樣本。對於one shot來說,support num per class 1,query num per class 19。每個影象都與筆畫資料配對,座標序列為 x,y,t x...