Pandas常用功能

2021-10-22 16:59:34 字數 4771 閱讀 1504

02 | 查詢

03 | 行列操作

04 | 資料統計

05 | 資料預處理

8.pd.set_option-設定pycharm顯示行數

06 | 取值

11.rotation-文字方向

14.df.eval( )

15.df.drop_duplicates( )

16.select_dtypes

17.lambda x

import pandas as pd

data1 =

# 預設column是a,b,c

df1 = pd.dataframe(data1,index =

['d'

,'e'

,'f'])

print

(df1)

a b c

d 147

e 258

f 3

69

# 刪除數列 首行

df.to_csv(

'd:\pycharm\df.csv'

,header =

none

,index=

false

)

df = dataframe(

) df.shape # 檢視index和column的數量

df.head(

)#返回前五行資料

df.tail(

)#返回後五行資料

df.to_csv(

'***.csv'

)#儲存為csv檔案

pd.read_csv(

r'路徑'

)#讀取檔案

df.info(

)#檢視索引、資料型別和記憶體資訊

df.describe(

)#檢視數值型列的匯**計

df.index # 檢視index

del

(df[

'column'])

#刪除某一列

df.drop[labels =1]

#刪除某一行

df = pd.reshape(data,(5

,5))

df2.rename(columns =

,inplace =

true

)#存活1,死亡0

df[

'是否逾期'

].value_counts(

)

data_detail = lapras.detect(df)

.sort_values(

'size'

)

df1 = pd.cut(df.price,10)

# 10代表組數

'中國'

]df1[

'province'

]= df1[

'province'].

str.replace(

'省','')

.str

.replace(

'壯族自治區',''

).str.replace(

'維吾爾自治區',''

).str.replace(

'自治區',''

)

# 資料清洗時,會將帶空值的行刪除,此時dataframe或series型別的資料不再是連續的索引

)

# 取country列中值等於「中國」的所有行

df1 = df.loc[df[

'country']==

'中國'

]

# 將0、1、2的值修改

df.loc[df.gender ==0,

'gender']=

'男性'

df.loc[df.gender ==1,

'gender']=

'女性'

x = data[

['high'

,'low'

,'open'

,'volume']]

.values # 將dataframe轉為numpy

df1[

'province'

].value_counts(ascending =

false

).head(10)

.plot(kind =

'bar'

)plt.xticks(rotation =0)

# 橫向排列

# 排序統計dataframe裡面city的數量

count = df.groupby(

['city'])

['fans'

].agg(

['sum'])

count.reset_index(inplace =

true

)# reset 之後變成新的dataframe,index為0開始,column為city,sum

# 取name的唯一值

rank_review = df.drop_duplicates(

['name'])

.sort_values(

'reviews'

,ascending=

false

).head(

10)

df_str = df.select_dtypes(include =

object

)df_notstr = df.select_dtypes(exclude =

object

)# 不包括object的字元

# 將df資料的特定列中,大於81的數值定義為1,小於81的定義為0

rfm_demo1[

'r_score'

]= rfm_demo1.r.

(lambda x:

1if x >

81else

0)

def

func1

(x):

if x >=

800:

return

4elif x >=

600and x <

800:

return

3elif x >=

400and x <

600:

return

2elif x >=

200and x <

400:

return

1else

:return

0

rfm_demo1[

'r_score'

]= rfm_demo1.r.

(func1)

Pandas常用功能

在使用pandas之前,需要匯入pandas庫 import pandas as pd pd作為pandas的別名 常用功能如下 功能 1 dataframe 建立乙個dataframe物件 2 df.values 返回ndarray型別的物件 3 df.index 獲取行索引 4 df.colum...

Pandas常用功能 自用

df.to csv 希臘債務.csv index none encoding utf 8 sig sep t head list 天數 性別 身高 失蹤地點 失蹤年 失蹤月 到達地 df dealed pd.dataframe dealed list,columns head list 新增行名 d...

pandas 處理資料常用功能

mean 也可設定skipna false,預設為true,跳過空值 count min sum median quantile q 0.75 統計分位數 std var skew kurt 標準差,方差,偏度,峰度 cumsum cumprod cummax cummin 累計和,差,最大值,最小...