我們把每乙個column作為乙個樣本資料集,就可以對其進行一些統計學方法的計算,比如求和sum、求平均mean、求方差var、求標準差std、求個數count、求最大值max、求最小值min,等操作。我們用以下**來進行演示:
import pandas as pd
dict_data =
df_data = pd.dataframe(dict_data,
columns=
['gender'
,'score'],
index=
["li lei"
,"han meimei"
,"tom"
,"adam"
,"betty"
,"curry"])
print
('*********sum***********'
)print
(df_data.
sum())
print
('*********count***********'
)print
(df_data.count())
print
('*********min***********'
)print
(df_data.
min())
print
('*********max***********'
)print
(df_data.
max())
print
('*********mean***********'
)print
(df_data.mean())
print
('*********median***********'
)print
(df_data.median())
print
('*********var***********'
)print
(df_data.var())
print
('*********std***********'
)print
(df_data.std(
))
輸出的結果如下所示:
**
*******
sum**
****
****
*gender mfmmfm
score 549
dtype:
object
****
****
*count**
****
****
*gender 6
score 6
dtype: int64
****
****
*min
****
*******
gender f
score 82
dtype:
object
****
****
*max
****
*******
gender m
score 98
dtype:
object
****
****
*mean**
****
****
*score 91.5
dtype: float64
****
****
*median**
****
****
*score 92.5
dtype: float64
****
****
*var**
****
****
*score 30.7
dtype: float64
****
****
*std**
****
****
*score 5.540758
dtype: float64
[finished in
4.6s]
python會自動判斷哪些列可以進行統計**算,如果無法進行計算的話會自動跳過,當然我們也可以指定某一列進行精準的計算,比如對score一列進行求標準差運算,就可以在data後加上引用標誌方括號,然後把score引數填進去。
print
(df_data[
'score'
].std(
))
pandas中dict和dataFrame互轉
pd.dataframe dict a 使用df.to dict 缺省會把key和值分開 引數 dict 預設 list series split records index 如果是list dict 這種巢狀情況轉的df,迴轉需要使用records 拿上面的資料舉例,df b a b c 0 0 ...
pandas中的資料結構 DataFrame
型的資料結構 修改某一行 frame.values 0 d 2 frame name1 pay2 x d 2 y b 6000 z c 9000 修改某一行的值 frame.values 1 1 9000 frame name1 pay2 x d 2 y b 9000 z c 9000 獲取某行資料...
DataFrame學習二 DataFrame的性質
2.1 索引 切片 資料集 data frame2 pd.dataframe data,index one two three four five columns year state pop debt 返回一列資料 frame2 year 返回多列多行 返回兩行 frame2 two three ...