按數值,列表,函式,區間,條件的查詢方法
1.df.loc:根據行列的標籤值進行查詢
2.df.iloc:根據行列的位置進行查詢
3.df.where
4.df.query
@用單個lable值查詢資料
@使用值列表批量查詢
@使用資料區間進行範圍查詢
import pandas as pd
df=pd.read_csv(
"檔案位置"
)df.head#檢視檔案前幾行資料
df.set_index(
'列名索引'
,implace=
true
)df.index#索引資料
df.head#輸出的是對應改索引為第一列,每行為改索引資料
df.loc[:,
'bwendu'
]= df[
'bwendu'].
str.replace(
"c","")
.astype(
"int32"
)#將溫度裡面的c替換成空白
#根據單個lable值查詢資料
df.loc[
'前面索引資料值(lable)'
,'需要查詢的列名索引'
]df.loc[
'前面索引資料值(lable)',[
'需要查詢的列名索引'
,'需要查詢的列名索引'
,'需要查詢的列名索引']]
#根據值列表批量查詢
df.loc[
['前面索引資料值(lable)'
,'前面索引資料值(lable)'
,'前面索引資料值(lable)'],
['需要查詢的列名索引'
,'需要查詢的列名索引'
,'需要查詢的列名索引']]
#使用數值區間查詢
df.loc[
'前面索引資料值(lable)'
:'前面索引資料值(lable)'
,'需要查詢的列名索引'
:'需要查詢的列名索引'
]#使用條件查詢
df.loc[df[
"需要查詢的列名索引"
]<-10
,:]#觀察下這列的布林條件
df["需要查詢的列名索引"
]<-10
#組合條件查詢
df.loc[
(df[
"需要查詢的列名索引"
]<
-110)&
(df[
"需要查詢的列名索引"]==
10)&(df[
"需要查詢的列名索引"]==
'晴'),:
]#呼叫函式查詢
#方式一
df.loc[lamba df :
(df[
"需要查詢的列名索引"
]<=30)
&(df[
"需要查詢的列名索引"
]>=15)
,:]#方式二
defquery_my_data
(df)
:return df.index.
str.startswith(
"前面索引資料值(lable)#由於是str,可以不完整資料值"
)&df[
"需要查詢的列名索引"]==
1df.loc[query_my_data,
:]
pandas提取資料的6種方法
pandas是python資料分析必備工具,它有強大的資料清洗能力,往往能用非常少的 實現較複雜的資料處理。import pandas as pd data pd.read excel 超市運營資料模板.xlsx 第一種方法,用比較運算子 data data.性別 男 第二種方法,用比較函式 eq ...
加快 hive 查詢的 5 種方法
1.使用 tez set hive.execution.engine tez 2.使用 orcfile。當有多個表 join 時,使用 orcfile 進行儲存,會顯著地提高速度。create table a orc customerid int,name string,age int,addres...
匯出hive表資料的5種方法
下面介紹一下hive 匯出的幾種方式 本地檔案直接匯出 insert overwrite local directory data hive export student info select from default.student修改分隔符和換行符 insert overwrite local...