import pandas as pd
import numpy
# 匯入資料
df = pd.read_csv(filepath_or_buffer="d:") df_new = df.set_index(["country"]) df_new.loc[list(["canada"])] # 1 df_new.loc[df_new["duration"]>160] # 2 df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1
# 3 df_new.loc[df_new["duration"].isin([100])] # 4 df_new.query("duration > 100 & index == 'uk'") # 5
1:根據列中的元素,選取對應元素的資料集
2:根據元素的選取條件來選取對應的資料集
3:根據元素的選取條件來來選取對應的資料集,並在符合條件的資料行新增flage標籤
4:isin函式是series用來判斷值是否在目標值是否在series
5:query函式中用來判斷條件符合的資料集並返回
df_new.iloc[0:4]
iloc比較簡單,它是基於索引位來選取資料集,0:4就是選取 0,1,2,3這四行,需要注意的是這裡是前閉後開集合
使用標籤選取資料:
df.loc[行標籤,列標籤]
df.loc['a':'b']#選取ab兩行資料
df.loc[:,'one']#選取one列的資料
df.loc的第乙個引數是行標籤,第二個引數為列標籤(可選引數,預設為所有列標籤),兩個引數既可以是列表也可以是單個字元,如果兩個引數都為列表則返回的是dataframe,否則,則為series。
pandas中loc和iloc方法
我們建立乙個dataframe import numpy as np import pandas as pd df pd.dataframe np.arange 16 reshape 4,4 index list abcd columns list abcd in df out a b c d a ...
pandas的索引問題(iloc和loc)
loc指的是定位索引,英文意思是loction iloc指的是數字定位索引,int location表示這個只能通過整數索引來取出元素 取出指定的某幾行,或某幾列 這個方法是在需要取出特定的行或者列的時候用,行或者列可以不填,預設選擇是全部行或者全部列 區域選擇 這個方法是比較常用的選擇子區域的方法...
pandas入門 loc與iloc函式
import pandas as pd import numpy 匯入資料 df pd.read csv filepath or buffer d df new df.set index country df new.loc list canada 1 df new.loc df new durat...