✦選擇資料
1、loc:通過行和列的名字來獲取值
注意:iloc使用索引定位時,會按照索引規則取值,如[1:5]會取出1,2,3,4這4個值
loc按照label標籤取值,如[『a』:『c』]則a,b,c都取到
3、at:通過行列標籤獲得指定值(獲得單個資料)
4、iat:通過行列標籤的整數索引來選取指定值
5、布林型別的陣列:通常用於篩選符合某些條件的行
✦處理丟失資料
1、dropna(axis=0, how=『any』, thresh=none, subset=none, inplace=false) #預設丟棄含有缺失值的行
引數說明:
axis:軸。0或』index』,表示按行刪除;1或』columns』,表示按列刪除。
how:篩選方式。『any』,表示該行/列只要有乙個以上的空值,就刪除該行/列;『all』,表示該行/列全部都為空值,就刪除該行/列。
thresh:非空元素最低數量。int型,預設為none。如果該行/列中,非空元素數量小於這個值,就刪除該行/列。thresh=n保留至少有n個非nan資料的行
subset:子集。列表,元素為行或者列的索引。如果axis=0或者『index』,subset中元素為列的索引;如果axis=1或者『column』,subset中元素為行的索引。由subset限制的子區域,是判斷是否刪除該行/列的條件判斷區域。
inplace:是否原地替換。布林值,預設為false。如果為true,則在原dataframe上進行操作,返回值為none。
引數說明:
value:被填充的資料
method:填充的方式,backfill,bfill,pad,ffill
limit:限制填充個數
3、.isnull()判斷是否有控制,多用於整體檢驗
.isnan()多用於單個值的檢驗
注意1、np.nan不是乙個空物件,用i is none 判斷是false
2、對某個值是否為空值進行判斷,只能哦那個np.isnan(i)
3、np.nan非空物件,型別為float
✦匯入匯出
參考官方教程
✦合併
Pandas學習筆記(二)
注意講述如何獲取乙個dataframe的某些行和某些列 注意value count 0方法,可以利用這個函式獲知某一列的各個取值的個數 主要講述如何按照人為設定的條件去選取dataframe的部分行和部分列。示例語句 is noise complaints complaint type noise ...
pandas基礎學習筆記二
二 多級索引 三 索引設定 3.set index和reset index 4.rename axis和rename 四 常用索引型函式 五 重複元素處理 六 抽樣函式 第2章 索引.ipynb 寫在前面的,按照教程中的內容都在電腦上敲了一遍 但還是感覺雲裡霧裡的。知識點很多,也有很多經驗的傳授,回...
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...