loc——通過行標籤索引行資料
loc[1]表示索引的是第1行(index 是整數)
import pandas as pd
data = [[1,2,3],[4,5,6]]
index = [0,1]
columns=['a','b','c']
df = pd.dataframe(data=data, index=index, columns=columns)
print df.loc[1]
'''''
a 4
b 5
c 6
'''
loc[『d』]表示索引的是第』d』行(index 是字元)
import pandas as pd
data = [[1,2,3],[4,5,6]]
index = ['d','e']
columns=['a','b','c']
df = pd.dataframe(data=data, index=index, columns=columns)
print df.loc['d']
'''''
a 1
b 2
c 3
'''
實際應用,在補全缺失值時非常有幫助,例如在進行kaggle-titanic比賽的時候,
df.loc[ (df.age.isnull()), 'age' ] = predictedages
使用隨機森林獲得的predictedages 值,填補資料集中age特徵的缺失值,(df.age.isnull())
確定行,'age'
確定列。
在將cabin特徵進行補全時,同樣處理。
df.loc[ (df.cabin.notnull()), 'cabin' ] = "yes"
df.loc[ (df.cabin.isnull()), 'cabin' ] = "no"
Pandas中loc和iloc函式用法詳解
loc函式 通過行索引 index 中的具體值來取行資料 如取 index 為 a 的行 iloc函式 通過行號來取行資料 如取第二行的資料 本文給出loc iloc常見的五種用法,並附上詳細 1 利用loc iloc提取行資料 import numpy as np import pandas as...
Pandas中loc和iloc函式的用法
loc表示location的意思 iloc中的loc意思相同,前面的i表示integer,所以它只接受整數作為引數。import pandas as pd import numpy as np np.random.randn 5,2 表示返回5x2的矩陣,index表示行的編號,columns表示列...
pandas的索引問題(iloc和loc)
loc指的是定位索引,英文意思是loction iloc指的是數字定位索引,int location表示這個只能通過整數索引來取出元素 取出指定的某幾行,或某幾列 這個方法是在需要取出特定的行或者列的時候用,行或者列可以不填,預設選擇是全部行或者全部列 區域選擇 這個方法是比較常用的選擇子區域的方法...