pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯**計,用於從 series 中提取單個值(如 sum/mean),或者從 dataframe 的行或列中提取乙個 series。
in [
144]
: df = dataframe([[
1,np.nan],[
2,3]
,[np.nan,np.nan],[
0,2]
],..
.: index=
['a'
,'b'
,'c'
,'d'
],columns=
['one'
,'two'])
in [
145]
: df
out[
145]
: one two
a 1.0 nan
b 2.0
3.0c nan nan
d 0.0
2.0# sum 方法返回乙個含有列小計的 series
in [
146]
: df.
sum(
)out[
146]
: one 3.0
two 5.0
dtype: float64
# axis 將會按行進行求和運算,na 值會自動被排除
in [
147]
: df.
sum(axis=1)
out[
147]
: a 1.0
b 5.0
c 0.0
d 2.0
dtype: float64
# 通過 skipna 引數可以禁用 na 值參與計算
# idxmax、idxmin 返回的是間接統計(比如達到最小值或最大值的索引)
in [
153]
: df.idxmax(
)out[
153]
: one b
two b
dtype:
object
# cumsum 則是累計型的
in [
154]
: df.cumsum(
)out[
154]
: one two
a 1.0 nan
b 3.0
3.0c nan nan
d 3.0
5.0
describe 用於一次性產生多個匯**計:
相關係數與協方差p156
唯一值、值計數以及成員資格
從一維 series 中提取不重複的值時,可以使用 unique 函式:
in [
156]
: obj = series(
['c'
,'a'
,'d'
,'a'
,'a'
,'b'
,'b'
,'c'
,'c'])
in [
157]
: obj.unique(
)out[
157]
: array(
['c'
,'a'
,'d'
,'b'
], dtype=
object
)
value_counts 用於計算乙個 series 中各值出現的頻率:
in [
160]
: obj.value_counts(
)out[
160]
: c 3
a 3
b 2
d 1
dtype: int64
# 頂級 pandas 方法,可用於任何陣列或序列
in [
162]
: pd.value_counts(obj.values, sort=
false
)out[
162]
: a 3
c 3
b 2
d 1
dtype: int64
isin 用於判斷向量化集合的成員資格,可用於選取 series 中或 dataframe 列中資料的子集:
pandas彙總和計算描述統計
pandas 物件擁有一組常用的數學和統計方法。他們大部分都屬於簡約和匯 計,用於從series中提取單個值 如sum或mean 或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比,他們都是基於沒有缺失資料的假設而構建的。看例子 呼叫dataframe的sum方法將...
pandas入門 彙總和計算描述統計
from pandas import dataframe,series import numpy as np df dataframe 1.4,np.nan 7.1,4.5 np.nan,np.nan 0.75,1.3 index a b c d columns one two print df o...
Junit 4功能彙總和簡述
此處不細說,直接參考簡單明瞭的wiki吧,裡面的內容就是junit4 jar包的使用和執行簡單測試例項,10分鐘即可完成入門 junit4幾乎所有功能官方彙總列表,可從此了解junit4的各種功能,官方wiki相當簡潔明瞭 此處對較重要的功能稍微彙總,若有感興趣的功能可到官方wiki進一步了解 注意...