本文的主要內容是基於中國大學mooc(慕課)中的「python資料分析與視覺化」課程進行整理和總結。
兩個事物,表示成x和y,如何判斷他們之間的相關性?
x增大,y也增大,兩個變數正相關;
x增大,y減小,兩個變數負相關;
x增大,y沒有明顯變化,兩個變數不相關;
度量兩個資料的相關性有以下方法: 方法
說明.cov()
計算協方差矩陣
.corr()
計算相關係數矩陣,pearson,spearman,kendall等係數
hprie = pd.series([3
,22,12
,22,12
],index=
['2008'
,'2009'
,'2010'
,'2011'
,'2012'])
m2 = pd.series([8
,15,10
,23,10
],index=
['2008'
,'2009'
,'2010'
,'2011'
,'2012'
])
hprie.corr(m2)
0.8384822301002933
spearman相關性分析 相關性分析
r語言常用函式 cor 預設結果為矩陣 cor mydat,use method use 缺失值的處理,method 處理方法 cor x,y 可以計算非方形矩陣,x y分別為2個矩陣,相同的行數 cor.test x,y,alternative method x y為檢驗相關性的變數 librar...
資料相關性分析
源於 python資料分析與挖掘實戰 coding utf 8 import pandas as pd catering sale data catering sale all.xls data pd.read excel catering sale,index col u 日期 data.corr...
相關性分析
1.圖表 折線圖 散點圖2.協方差及協方差矩陣協方差 用來衡量兩個變數的總體誤差。只能對兩組資料進行分析 3.相關係數 correlation coefficience 可以對相關的密切程度進行度量弊端 因為沒有模型,所以無法進行 正態性檢驗 t檢驗 假設檢驗 異常值檢驗 箱線圖法 q1 位於25 ...