dataframe有許多的的屬性和方法使得pabdas用起來非常的快捷簡便。
匯入資料:
1import
pandas as pd
2import
numpy as np
3from pandas import
series,dataframe
4 test=pd.read_excel("
/users/yaozhilin/downloads/資料.xls
",sep="t"
)5 test.head(5)#
顯示前五行
•屬性
test.columns 獲取dataframe的列名
test.index 獲取dataframe的索引名
test.dtypes 獲取dataframe的沒列資料的屬性
test.shape 獲取dataframe的行和列數
test.size 獲取dataframe的總元素
1 test.columns1 test.indexrangeindex(start=0, stop=91, step=1)1 test.dtypes公司名稱 object聯絡人姓名 object
聯絡人頭銜 object
位址 object
** object
傳真 object
電子郵件 object
日期 datetime64[ns]
附件 float64
dtype: object
1 test.shape(91, 9)1 test.size819•方法方法使用1、head() 顯示資料前幾行(預設5行)
2、tail() 顯示資料後幾行(預設5行)
3、rename(index/columns=) 資料索引或列重新命名
4、replace(columns:) 替換資料
5、unique 顯示唯一值
6、sort_index 索引排序
7、sort_values 值排序
8、value_counts 統計每個值的數量
9、describe
統計所有值的資料
10、max/min/sum/mean
11、reindex 建立新索引
下面舉幾個列子
職位"].unique()
array(['銷售代表', '物主', '採購員', '市場經理', '結算經理', '銷售**', '銷售員', '銷售經理', '市場助理','助理銷售**', '助理銷售代表', '物主/市場助理'], dtype=object)
1 len(test["職位"].unique())
12sort_index
1 test.sort_index(ascending=false).head(5)#ascending預設為true
姓名","
職位"]).head(4)
判斷該資料中是否有重複值
false 91dtype: int64
1 test["職位"].value_counts()
銷售代表 17物主 17
市場經理 12
銷售經理 11
結算經理 10
銷售員 7
市場助理 6
銷售** 5
採購員 2
助理銷售** 2
助理銷售代表 1
物主/市場助理 1
name: 職位, dtype: int64
describe
1 test["附件"]=range(91)
DataFrame常用操作
檢視dataframe中的內容 persondf.show 檢視dataframe部分列中的內容 persondf.select persondf.col name show persondf.select col name col age show persondf.select name sho...
Dataframe常用操作
每次用dataframe的時候,各種操作想不起來,找來找去的 整理乙個自己常用的 刪除某列 del data column name data.drop winter axis 1,inplace true 刪除某行 data.drop data.index 16 17 inplace true r...
python的dataframe常用操作
data dataframe np.arange 16 reshape 4,4 index list abcd columns list wxyz print data print data 0 2 取前兩行資料 print print len data 求出一共多少行 print data.col...