資料探勘之擬合優度檢驗

2021-09-02 02:09:34 字數 1148 閱讀 7858

本部落格根據非常好的excel資料而編寫,使用python語言操作,預計使用一周的時間更新完成。需要《非常好的excel資料》word文件,歡迎發郵件給[email protected],免費發放。這篇部落格對應《非常好的excel資料》裡的第4章節。

① 資料

②python**如下

def lilunpinshu(n,m,v,pingshu,qujianduandian):

j=0a=

# s=sum(tree111)

s = sum(pingshu)

for i in range(0,n):

if i==0:

aa=s*stats.norm.cdf(qujianduandian[i],m,v)

## aa=s*stats.norm.cdf(tree113[i],m,v)

else:

cc=stats.norm.cdf(qujianduandian[i],m,v)

c=stats.norm.cdf(qujianduandian[i-1],m,v)

return a

import pandas as pd

from scipy import stats

from scipy.stats import chisquare

tree=pd.read_csv('d:\data.csv',encoding='gbk')

tree11=tree.iloc[0:12,7:]

tree111 = list(tree11['頻數'][:9])

tree112 = list(pd.to_numeric(tree11['理論頻數'][:9]))

tree113 = list(tree11['unnamed: 10'][:9])

結果圖

所以此資料服從正態分佈

擬合優度檢驗

可決係數 coefficient of determination 如果樣本回歸線對樣本觀測值擬合程度越好,各樣本觀測點與回歸線靠得越近,由樣本回歸做出解釋的離差平方和與總離差平方和越相近 反之,擬合程度越差,相差越大。可決係數的計算式 可決係數可以作為綜合度量回歸模型對樣本觀測值擬合優度的度量指標...

回歸方程的擬合優度檢驗 別錯過,卡方檢驗實用總結!

通常情況下,卡方檢驗是研究分類資料與分類資料之間關係的分析方法,如性別和是否戴 眼鏡之間的關係。卡方檢驗通常會涉及卡方值和p值兩個名詞術語。卡方值與p值有對應關係,p值小於0.05則說明有差異存在,即性別與是否戴 眼鏡之間有聯絡。在具體差異分析的基礎上,進一步分析不同性別樣本戴 眼鏡的百分比,例如,...

卡方分布 卡方分布與擬合優度的卡方檢驗是什麼關係?

在分類資料擬合優度的 該統計量 服從 的 分布。其中,為某分類實際頻數,為零假設中的期望頻數,為分類類別的數量。對於分類資料的擬合優度 檢驗,很多統計教科書介紹完上面這些就結束了。但相信初學者,尤其是非統計專業的初學者會和我一樣,都存在乙個疑問,式1中的檢驗統計量 為什麼會服從 分布呢?這個疑問非常...