pandas是python資料分析必備工具,它有強大的資料清洗能力,往往能用非常少的**實現較複雜的資料處理。
import pandas as pd
data=pd.read_excel(
'超市運營資料模板.xlsx'
①第一種方法,用比較運算子『==』:
data[data.性別==
'男']
②第二種方法,用比較函式』eq』:
data[data[
'性別'
].eq(
'男')
①第一種方法,用比較運算子『<=』:
data[data.入學年份<=
2017
]
②第二種方法,用比較函式』le』:
data[data[
'入學年份'
data[data.入學年
2017
]
②第二種方法,用比較函式』ge』:
data[data[
'入學年份'
①第一種方法,用比較運算子『!=』:
data[data.姓名!=
'王五'
]
②第二種方法,用比較函式』ne』:
data[data[
'姓名'
].ne(
'王五'
'入學年份'
]=data[
"入學年份"
].astype(
'datetime64'
)#如果已為日期格式則此步驟可省略
print
(data[
'入學年份'])
import datetime
s_date = datetime.datetime.strptime(
'2018-08-31'
,'%y-%m-%d'
).date(
)#起始日期
e_date = datetime.datetime.strptime(
'2018-10-01'
,'%y-%m-%d'
).date(
)#結束日期
①第一種方法,用邏輯運算符號』>』 『
pandasdatetime64[ns]不能直接與datetime.date相比,需要用pd.timestamp進行轉化
data[
(data.入學年pd.timestamp(s_date))&
(data.入學年份
)]
②第二種,用比較函式』gt』『lt』和』&』:
data[
(data[
'入學年份'
].lt(pd.timestamp(e_date)))
&(data[
'入學年份'
].gt(pd.timestamp(s_date)))
]
id_a=data.入學年份.
(lambda x: x.year ==
2018
and x.month==9)
data[id_a]
④第四種,用between函式實現:
id_b=data.入學年份.between(pd.timestamp(s_date)
,pd.timestamp(e_date)
)data[id_b]
①第一種,用contains函式:
data[
'班級'
]=data[
'班級'
].values.astype(
'str'
)#將該列轉換為字元資料型別
id_c=data.班級.
str.contains(
'1503'
,na=
false
)data[id_c]
②第二種,用isin函式:
id_i=data.類別id.isin(
['000'])
#接受乙個列表
data[id_i]
#isin函式搞不定,因為它只能判斷該列中元素是否在列表中
Pandas查詢資料的5種方法
按數值,列表,函式,區間,條件的查詢方法 1.df.loc 根據行列的標籤值進行查詢 2.df.iloc 根據行列的位置進行查詢 3.df.where 4.df.query 用單個lable值查詢資料 使用值列表批量查詢 使用資料區間進行範圍查詢 import pandas as pd df pd....
網頁提速的6種方法
1 優化 從而減少載入時間,2 格式 3 優化您的css 網頁設計使用的css需要進行優化。cleancss 4 在鏈結後面使用斜線 當使用者開啟乙個像 http www.domain.com about 這樣的鏈結時,伺服器會推測鏈結這個位址包含哪種檔案或頁面。如果在連線後加上斜線 伺服器就知道這...
網頁提速的6種方法
1 優化 從而減少載入時間,2 格式 3 優化您的css 網頁設計使用的css需要進行優化。cleancss 4 在鏈結後面使用斜線 當使用者開啟乙個像 http www.domain.com about 這樣的鏈結時,伺服器會推測鏈結這個位址包含哪種檔案或頁面。如果在連線後加上斜線 伺服器就知道這...