單樣本t檢驗——乙個連續變數與乙個數值的顯著性關係
sm.stats.descrstatsw(a[b].ttest_mean(0.1)) 0.1為引數
雙樣本t檢驗——乙個分類變數(二分類)與乙個連續變數的顯著性關係
方差齊性檢查
a1 = creditcard_exp[a[b]==0][c]
a2 = creditcard_exp[a[b]==1][c]
levene = stats.levene(a1,a2,center=『median』)
雙樣本t檢驗
stats.stats.ttest_ind(a1,a2,equal_var=true)
相關性檢驗——多個連續變數關係
a[[b,c]].corr(method=『pearson』) 線性
a[[b,c]].corr(method=『spearman』) 秩
a[[b,c]].corr(method=『kendall』)非線性
卡方檢驗——兩個定類變數
a= pd.read_csv(『accepts.csv』)
z = pd.crosstab(a.b,a.c,margins=true)
x= z.div(z[『all』],axis=0)
python基礎分析 資料分析 Python基礎
學python前要明確其使用目的。學python是為了進行資料分析,所以現階段最主要的任務是了解python的最基礎知識,然後通過運用python進行資料分析的專案,從而學會使用python。一 資料型別 1 整數 浮點數 字串 2 列表 list 2list.count obj 統計某個元素在列表...
python資料分析基礎
python資料分析基礎 學資料分析之前應該明白整個資料分析的基本流程 1.明確需求與目的 2.資料收集 3.資料預處理 4.資料分析 5.編寫報告 假設檢驗,也稱為顯著性檢驗,是通過樣本的統計量,來判斷與總體引數之間是否存在差異 差異是否顯著 即我們對總體引數進行一定的假設,然後通過收集到的資料,...
python資料分析基礎
學資料分析之前應該明白整個資料分析的基本流程 1.明確需求與目的 2.資料收集 3.資料預處理 4.資料分析 5.編寫報告 假設檢驗,也稱為顯著性檢驗,是通過樣本的統計量,來判斷與總體引數之間是否存在差異 差異是否顯著 即我們對總體引數進行一定的假設,然後通過收集到的資料,來驗證我們之前作出的假設 ...