1、輸出百分比變化以及前後指定的行數
a = np.arange(1,13).reshape(6,2)
data = dataframe(a)
#計算列的百分比變化,如果想計算行設定axis=1
print(data.pct_change())
'''0 1
0 nan nan
1 2.000000 1.000000
2 0.666667 0.500000
3 0.400000 0.333333
4 0.285714 0.250000
5 0.222222 0.200000程式設計客棧
'''#輸出前五行,預設是5,可以通過設定n引數來設定輸出的行數
print(data.head())
'''0 1
0 1 2
1 3 4
2 5 6
3 7 8
4 9 10
'''#輸出最後五行
print(data.tail())
'''0 1
1 3 4
程式設計客棧2 5 6
3 7 8
4 9 10
5 11 12
'''2、計算dataframe列與列的相關係數和協方差
a = np.arange(1,10).reshape(3,3)
data = dataframe(a,index=["a","b","c"],columns=["one","two","three"])
print(data)
'''one two three
a 1 2 3
b 4 5 6
c 7 8 9
'''#計算第一列和第二列的相關係數
print(data.one.corr(data.two))
#1.0
#返回乙個相關係數矩陣
print(data.corr())
'''one two three
one 1.0 1.程式設計客棧0 1.0
two 1.0 1.0 1.0
three 1.0 1.0 tbchz1.0
'''#計算第一列和第二列的協方差
print(data.one.cov(data.two))
#9.0
#返回乙個協方差矩陣
print(data.cov())
'''one two three
one 9.0 9.0 9.0
two 9.0 9.0 9.0
three 9.0 9.0 9.0
'''3、計算dataframe與列或者series的相關係數
a = np.arange(1,10).tbchzreshape(3,3)
data = dataframe(a,index=["a","b","c"],columns=["one","two","three"])
print(data)
'''one two three
a 1 2 3
b 4 5 6
c 7 8 9
'''#計算data與第三列的相關係數
print(data.corrwith(data.three))
'''one 1.0
two 1.0
three 1.0
'''#計算data與series的相關係數
#在定義series的時候,索引一定要去dataframe的索引一樣
s = series([5,3,1],index=["a","b","c"])
print(data.corrwith(s))
'''one -1.0
two -1.0
three -1.0
'''注意:在使用dataframe或series在計算相關係數或者協方差的時候,都會計算索引重疊的、非na的、按照索引對齊原則,對於無法對齊的索引會使用na值進行填充。在使用dataframe與指定的行或列或series計算協方差和相關係數的時候,預設都是與dataframe的列進行計算,如果想要計算行,設定axis引數為1即可。
本文位址:
期望 方差 協方差 相關係數
一 期望 在概率論和統計學中,數學期望 或均值,亦簡稱期望 是試驗中每次可能結果的概率乘以其結果的總和。它反映隨機變數平均取值的大小。線性運算 推廣形式 函式期望 設f x 為x的函式,則f x 的期望為 離散函式 連續函式 注意 函式的期望不等於期望的函式 一般情況下,乘積的期望不等於期望的乘積 ...
相關係數矩陣計算 期望 方差 協方差 相關係數
第一部分 理論部分 注 對以上的擴充套件涉及到矩 協方差矩陣 第二部分 實驗部分 編譯器 python 3.6 作 者 寒木雅 計算樣本期望 均值 方差 標準差 協方差 相關係數import numpy as np 生成隨機樣本x,yx np.random.randint 0,10,100 y np...
方差 協方差 相關係數的理解
協方差對於變數x y,協方差的定義為每個時刻的 x值與其均值之差 乘以 y值與其均值之差 的均值 其實是求 期望 因此,如果x與x的均值差與y與y的均值差的符號相同,則協方差值大於0,符號相反,則協方差值小於0,總結如下 圖2 圖3 圖4 解釋一 x 越大 y 也越大,x 越小 y 也越小,這種情況...