pandas提取資料的6種方法

2021-10-21 07:30:16 字數 2985 閱讀 6025

pandas是python資料分析必備工具,它有強大的資料清洗能力,往往能用非常少的**實現較複雜的資料處理。

import pandas as pd

data=pd.read_excel(

'超市運營資料模板.xlsx'

①第一種方法,用比較運算子『==』:

data[data.性別==

'男']

②第二種方法,用比較函式』eq』:

data[data[

'性別'

].eq(

'男')

①第一種方法,用比較運算子『<=』:

data[data.入學年份<=

2017

]

②第二種方法,用比較函式』le』:

data[data[

'入學年份'

data[data.入學年

2017

]

②第二種方法,用比較函式』ge』:

data[data[

'入學年份'

①第一種方法,用比較運算子『!=』:

data[data.姓名!=

'王五'

]

②第二種方法,用比較函式』ne』:

data[data[

'姓名'

].ne(

'王五'

'入學年份'

]=data[

"入學年份"

].astype(

'datetime64'

)#如果已為日期格式則此步驟可省略

print

(data[

'入學年份'])

import datetime

s_date = datetime.datetime.strptime(

'2018-08-31'

,'%y-%m-%d'

).date(

)#起始日期

e_date = datetime.datetime.strptime(

'2018-10-01'

,'%y-%m-%d'

).date(

)#結束日期

①第一種方法,用邏輯運算符號』>』 『

pandasdatetime64[ns]不能直接與datetime.date相比,需要用pd.timestamp進行轉化

data[

(data.入學年pd.timestamp(s_date))&

(data.入學年份

)]

②第二種,用比較函式』gt』『lt』和』&』:

data[

(data[

'入學年份'

].lt(pd.timestamp(e_date)))

&(data[

'入學年份'

].gt(pd.timestamp(s_date)))

]

id_a=data.入學年份.

(lambda x: x.year ==

2018

and x.month==9)

data[id_a]

④第四種,用between函式實現:

id_b=data.入學年份.between(pd.timestamp(s_date)

,pd.timestamp(e_date)

)data[id_b]

①第一種,用contains函式:

data[

'班級'

]=data[

'班級'

].values.astype(

'str'

)#將該列轉換為字元資料型別

id_c=data.班級.

str.contains(

'1503'

,na=

false

)data[id_c]

②第二種,用isin函式:

id_i=data.類別id.isin(

['000'])

#接受乙個列表

data[id_i]

#isin函式搞不定,因為它只能判斷該列中元素是否在列表中

Pandas查詢資料的5種方法

按數值,列表,函式,區間,條件的查詢方法 1.df.loc 根據行列的標籤值進行查詢 2.df.iloc 根據行列的位置進行查詢 3.df.where 4.df.query 用單個lable值查詢資料 使用值列表批量查詢 使用資料區間進行範圍查詢 import pandas as pd df pd....

網頁提速的6種方法

1 優化 從而減少載入時間,2 格式 3 優化您的css 網頁設計使用的css需要進行優化。cleancss 4 在鏈結後面使用斜線 當使用者開啟乙個像 http www.domain.com about 這樣的鏈結時,伺服器會推測鏈結這個位址包含哪種檔案或頁面。如果在連線後加上斜線 伺服器就知道這...

網頁提速的6種方法

1 優化 從而減少載入時間,2 格式 3 優化您的css 網頁設計使用的css需要進行優化。cleancss 4 在鏈結後面使用斜線 當使用者開啟乙個像 http www.domain.com about 這樣的鏈結時,伺服器會推測鏈結這個位址包含哪種檔案或頁面。如果在連線後加上斜線 伺服器就知道這...