Pandas常用功能

02 | 查詢

03 | 行列操作

04 | 資料統計

05 | 資料預處理

8.pd.set_option-設定pycharm顯示行數

06 | 取值

11.rotation-文字方向

14.df.eval( )

15.df.drop_duplicates( )

16.select_dtypes

17.lambda x

import pandas as pd
data1 =
# 預設column是a,b,c
df1 = pd.dataframe(data1,index =
['d'
,'e'
,'f'])
print
(df1)
a  b  c
d  147
e  258
f  3
69

# 刪除數列 首行
df.to_csv(
'd:\pycharm\df.csv'
,header =
none
,index=
false
)

df = dataframe(
) df.shape  # 檢視index和column的數量
df.head(
)#返回前五行資料 
df.tail(
)#返回後五行資料 
df.to_csv(
'***.csv'
)#儲存為csv檔案 
pd.read_csv(
r'路徑'
)#讀取檔案     
df.info(
)#檢視索引、資料型別和記憶體資訊 
df.describe(
)#檢視數值型列的匯**計 
df.index # 檢視index

del
(df[
'column'])
#刪除某一列
df.drop[labels =1]
#刪除某一行

df = pd.reshape(data,(5
,5))

df2.rename(columns =
,inplace =
true
)#存活1,死亡0

df[
'是否逾期'
].value_counts(
)

data_detail = lapras.detect(df)
.sort_values(
'size'
)

df1 = pd.cut(df.price,10)
# 10代表組數
'中國'
]df1[
'province'
]= df1[
'province'].
str.replace(
'省','')
.str
.replace(
'壯族自治區',''
).str.replace(
'維吾爾自治區',''
).str.replace(
'自治區',''
)

# 資料清洗時，會將帶空值的行刪除，此時dataframe或series型別的資料不再是連續的索引

)

# 取country列中值等於「中國」的所有行
df1 = df.loc[df[
'country']==
'中國'
]

# 將0、1、2的值修改
df.loc[df.gender ==0,
'gender']=
'男性'
df.loc[df.gender ==1,
'gender']=
'女性'

x = data[
['high'
,'low'
,'open'
,'volume']]
.values # 將dataframe轉為numpy

df1[
'province'
].value_counts(ascending =
false
).head(10)
.plot(kind =
'bar'
)plt.xticks(rotation =0)
# 橫向排列

# 排序統計dataframe裡面city的數量
count = df.groupby(
['city'])
['fans'
].agg(
['sum'])
count.reset_index(inplace =
true
)# reset 之後變成新的dataframe,index為0開始，column為city,sum
# 取name的唯一值
rank_review = df.drop_duplicates(
['name'])
.sort_values(
'reviews'
,ascending=
false
).head(
10)
df_str = df.select_dtypes(include =
object
)df_notstr = df.select_dtypes(exclude =
object
)# 不包括object的字元
# 將df資料的特定列中，大於81的數值定義為1，小於81的定義為0
rfm_demo1[
'r_score'
]= rfm_demo1.r.
(lambda x:
1if x >
81else
0)
def
func1
(x):
if x >=
800:
return
4elif x >=
600and x <
800:
return
3elif x >=
400and x <
600:
return
2elif x >=
200and x <
400:
return
1else
:return
0        
rfm_demo1[
'r_score'
]= rfm_demo1.r.
(func1)
				Pandas常用功能
在使用pandas之前，需要匯入pandas庫 import pandas as pd pd作為pandas的別名 常用功能如下 功能 1 dataframe 建立乙個dataframe物件 2 df.values 返回ndarray型別的物件 3 df.index 獲取行索引 4 df.colum...
				Pandas常用功能  自用
df.to csv 希臘債務.csv index none encoding utf 8 sig sep t head list 天數 性別 身高 失蹤地點 失蹤年 失蹤月 到達地 df dealed pd.dataframe dealed list,columns head list 新增行名 d...
				pandas 處理資料常用功能
mean 也可設定skipna false，預設為true，跳過空值 count min sum median quantile q 0.75 統計分位數 std var skew kurt 標準差，方差，偏度，峰度 cumsum cumprod cummax cummin 累計和，差，最大值，最小...

Pandas常用功能

Pandas常用功能

Pandas常用功能 自用

pandas 處理資料常用功能

相關推薦

Pandas常用功能自用