# 迭代器及使用
for idx,row in df.iterrows(
): row[
'id'
]
# 迭代器對每個元素進行處理
df.loc[i,
'鏈結'
]= f''
for i in df.name:
print
(i)# 迭代乙個列
# 按列迭代,[列名, 列中的資料序列 s(索引名 值)]
for label, content in df.items():
print
(label, content)
# 按行迭代,迭代出整行包括索引的類似列表的內容,可row[2]取
for row in df.itertuples():
print
(row)
df.at[
2018
,'總人口'
]# 按行列索引名取乙個指定的單個元素
df.iat[1,
2]# 索引和列的編號取單個元素
s.nlargest(5)
.nsmallest(2)
# 最大和最小的前幾個值
df.nlargest(3,
['population'
,'gdp'])
df.take([0
,3])
# 指定多個行列位置的內容
# 按行列擷取掉部分內容,支援日期索引標籤
ds.truncate(before=
2, after=
4)
# 將 dataframe 轉成 series
df.iloc[:,
0]float
(str
(val)
.rstrip(
'%')
)# 百分數轉數字
df.reset_index(inplace=
true
)# 取消索引
df[col]
# 根據列名,並以series的形式返回列
df[[col1, col2]
]# 以dataframe形式返回多列
df.loc[df[
'team']==
'b',
['name']]
# 按條件查詢,只顯示name 列
s.iloc[0]
# 按位置選取資料
s.loc[
'index_one'
]# 按索引選取資料
df.loc[0,
'a':
'b']
# a到 b 欄位的第一行
df.loc[
2018
:1990
,'第一產業增加值'
:'第三產業增加值'
]df.loc[0,
['a'
,'b']]
# d.loc[位置切片, 字段]
df.iloc[0,
:]# 返回第一行, iloc 只能是數字
df.iloc[0,
0]# 返回第一列的第乙個元素
dc.query(
'site_id > 8 and utype=="老客"'
).head(
)# 可以 and or / & |
Pandas資料的選取
使用python的工具包pandas,可以方便的處理資料。但是發現乙個問題 有時候總是不知道怎麼選取資料。因此在這裡記錄一下。由於在實際使用中,主要用到的就是dataframe的結構,因此,這裡主要說dataframe資料結構中,資料的選取方法。假設我們已經有了dataframe資料,呈現如下結構 ...
pandas 資料索引與選取
我們對 dataframe 進行選擇,大抵從這三個層次考慮 行列 區域 單元格。其對應使用的方法如下 一.行,列 df 二.區域 df.loc,df.iloc,df.ix 三.單元格 df.at,df.iat 下面開始練習 import numpy as np import pandas as pd...
Pandas中根據列的值選取多行資料
選取等於某些值的行記錄 用 df.loc df column name some value 選取某列是否是某一型別的數值 用 isin df.loc df column name isin some values 多種條件的選取 用 df.loc df column some value df o...