02 | 查詢
03 | 行列操作
04 | 資料統計
05 | 資料預處理
8.pd.set_option-設定pycharm顯示行數
06 | 取值
11.rotation-文字方向
14.df.eval( )
15.df.drop_duplicates( )
16.select_dtypes
17.lambda x
import pandas as pd
data1 =
# 預設column是a,b,c
df1 = pd.dataframe(data1,index =
['d'
,'e'
,'f'])
print
(df1)
a b c
d 147
e 258
f 3
69
# 刪除數列 首行
df.to_csv(
'd:\pycharm\df.csv'
,header =
none
,index=
false
)
df = dataframe(
) df.shape # 檢視index和column的數量
df.head(
)#返回前五行資料
df.tail(
)#返回後五行資料
df.to_csv(
'***.csv'
)#儲存為csv檔案
pd.read_csv(
r'路徑'
)#讀取檔案
df.info(
)#檢視索引、資料型別和記憶體資訊
df.describe(
)#檢視數值型列的匯**計
df.index # 檢視index
del
(df[
'column'])
#刪除某一列
df.drop[labels =1]
#刪除某一行
df = pd.reshape(data,(5
,5))
df2.rename(columns =
,inplace =
true
)#存活1,死亡0
df[
'是否逾期'
].value_counts(
)
data_detail = lapras.detect(df)
.sort_values(
'size'
)
df1 = pd.cut(df.price,10)
# 10代表組數
'中國'
]df1[
'province'
]= df1[
'province'].
str.replace(
'省','')
.str
.replace(
'壯族自治區',''
).str.replace(
'維吾爾自治區',''
).str.replace(
'自治區',''
)
# 資料清洗時,會將帶空值的行刪除,此時dataframe或series型別的資料不再是連續的索引
)
# 取country列中值等於「中國」的所有行
df1 = df.loc[df[
'country']==
'中國'
]
# 將0、1、2的值修改
df.loc[df.gender ==0,
'gender']=
'男性'
df.loc[df.gender ==1,
'gender']=
'女性'
x = data[
['high'
,'low'
,'open'
,'volume']]
.values # 將dataframe轉為numpy
df1[
'province'
].value_counts(ascending =
false
).head(10)
.plot(kind =
'bar'
)plt.xticks(rotation =0)
# 橫向排列
# 排序統計dataframe裡面city的數量
count = df.groupby(
['city'])
['fans'
].agg(
['sum'])
count.reset_index(inplace =
true
)# reset 之後變成新的dataframe,index為0開始,column為city,sum
# 取name的唯一值
rank_review = df.drop_duplicates(
['name'])
.sort_values(
'reviews'
,ascending=
false
).head(
10)
df_str = df.select_dtypes(include =
object
)df_notstr = df.select_dtypes(exclude =
object
)# 不包括object的字元
# 將df資料的特定列中,大於81的數值定義為1,小於81的定義為0
rfm_demo1[
'r_score'
]= rfm_demo1.r.
(lambda x:
1if x >
81else
0)
def
func1
(x):
if x >=
800:
return
4elif x >=
600and x <
800:
return
3elif x >=
400and x <
600:
return
2elif x >=
200and x <
400:
return
1else
:return
0
rfm_demo1[
'r_score'
]= rfm_demo1.r.
(func1)
Pandas常用功能
在使用pandas之前,需要匯入pandas庫 import pandas as pd pd作為pandas的別名 常用功能如下 功能 1 dataframe 建立乙個dataframe物件 2 df.values 返回ndarray型別的物件 3 df.index 獲取行索引 4 df.colum...
Pandas常用功能 自用
df.to csv 希臘債務.csv index none encoding utf 8 sig sep t head list 天數 性別 身高 失蹤地點 失蹤年 失蹤月 到達地 df dealed pd.dataframe dealed list,columns head list 新增行名 d...
pandas 處理資料常用功能
mean 也可設定skipna false,預設為true,跳過空值 count min sum median quantile q 0.75 統計分位數 std var skew kurt 標準差,方差,偏度,峰度 cumsum cumprod cummax cummin 累計和,差,最大值,最小...