value_counts()是一種檢視**某列中有多少個不同值的快捷方法,並計算每個不同值有在該列中有多少重複值。
value_counts()是series擁有的方法,一般在dataframe中使用時,需要指定對哪一列或行使用,該函式返回的也是series型別,且index為該列的不同值,values為不同值的個數
1 import pandas as pd資料樣例如下圖所示2 import numpy as np
3 filepath='c:\python\data_src\gfscofog_03-05-2018 03-04-36-54_timeseries\gfscofog_cha.csv'
4 data = pd.read_csv(filepath,encoding='utf-8')
2 #輸出
3 percent of gdp 3561
4 domestic currency 3561
5 percent of total expenditure 470
6 name: unit name, dtype: int64
data['sector name'].value_counts()
1 data['sector name'].value_counts()2 #輸出結果
3 extrabudgetary central government 1020
4 social security funds 1002
5 central government (incl. social security funds) 944
6 budgetary central government 944
7 local governments 944
8 general government 944
9 central government (excl. social security funds) 944
10 state governments 850
11 name: sector name, dtype: int64
pandas中DataFrame mean函式用法
mean 平均數 pandas中的df.mean 函式預設是等價於df.mean 0 即按軸方向求平均,得到每列資料的平均值。相反的df.mean 1 則代表按行方向求平均,得到每行資料的平均值。舉例 我們 首先匯入pandas包 import pandas as pd建立矩陣 首先使用預設方法 會...
Pandas中的分類
一 分類變數的結構 乙個分類變數包括三個部分,元素值 values 分類類別 categories 是否有序 order 從上面可以看出,使用cut函式建立的分類變數預設為有序分類變數 一 獲取分類屬性 a describe方法 該方法描述了乙個分類序列的情況,包括非缺失值個數 元素值類別數 不是分...
Pandas中resample方法詳解
pandas中的resample,重新取樣,是對原樣本重新處理的乙個方法,是乙個對常規時間序列資料重新取樣和頻率轉換的便捷的方法。方法的格式是 dataframe.resample rule how none axis 0 fill method none closed none label non...