pandas 基礎功能(二)

2021-10-09 02:46:44 字數 2225 閱讀 3667

pandas 基礎功能(二)

1.新增

2.刪除

3.修改資料

1.新增

1)在最後新增一列(列s):

df["列s]=list  ## 增加列的元素個數要跟原資料列的個數一樣

2)在指定位置新增一列(列q):

# 語法格式:列表.insert(index, obj)

# index --->物件 obj 需要插入的索引位置。

# obj ---> 要插入列表中的物件(列名)

col_name=df1.columns.tolist()                   # 將資料框的列名全部提取出來存放在列表裡

col_name.insert(n,'列q')                      # 在列索引為n的位置插入一列,列名為:city,剛插入時不會有值,整列都是nan

df1=df1.reindex(columns=col_name)

df['列q']=list

2.刪除

1)刪除具體的列

df.drop('列名a',axis=1,inplace=true)

#inplace值是true代表覆蓋源資料,false代表不覆蓋

2)刪除具體的行

df.drop('行索引值a',axis=0,inplace=true)

3)刪除第n行

df.drop(df.index[n])

4)刪除重複行

df.duplicated() #判斷是否有重複列

df.drop_duplicates()  #預設判斷全部的列判斷是否重複

df.drop_duplicates(subset=['列名a','列名b'],keep='first')

#當keep=false時,就是去掉所有的重複行

#當keep=『first』時,就是保留第一次出現的重複行

#當keep=』last』時就是保留最後一次出現的重複行。

#df[df.duplicated(keep=false)] #提取重複行

3.修改資料

1)為空資料處理

df.dropna()

dataframe.dropna(axis=0, how='any', thresh=none, subset=none, inplace=false)

#函式作用:刪除含有空值的行或列

#axis:維度,axis=0表示index行,axis=1表示columns列,預設為0

#how:"all"表示這一行或列中的元素全部缺失(為nan)才刪除這一行或列,"any"表示這一行或列中只要有元素缺失,就刪除這一行或列

#thresh:一行或一列中至少出現了(thresh的值)個才刪除。

#subset:在某些列的子集中選擇出現了缺失值的列刪除,不在子集中的含有缺失值得列或行不會刪除(有axis決定是行還是列)

#inplace:刷選過缺失值得新資料是存為副本還是直接在原資料上進行修改。

df.fillna()

#dataframe.fillna(value=none, method=none, axis=none, inplace=false, limit=none, downcast=none, **kwargs)

#函式作用:填充缺失值

#value:需要用什麼值去填充缺失值

#axis:確定填充維度,從行開始或是從列開始

#method:ffill:用缺失值前面的乙個值代替缺失值,如果axis=1,那麼就是橫向的前面的值替換後面的缺失值,如果axis=0,那麼則是上面的值替換下面的缺失值。backfill/bfill,缺失值後面的乙個值代替前面的缺失值。注意這個引數不能與value同時出現

#limit:確定填充的個數,如果limit=2,則只填充兩個缺失值。

df.isnull()

#判斷值是否為null

df.isna()

#判斷值是否為nan

2)修改行列值

修改行的值

df.iloc[2,:]=n    #n代表數字

df.iat[行索引,列索引="字串"

df["列a"]=df["列a"].replace("原有值","替換值",inplace=true)

修改列的值

df.loc[df."列a">5,"b"]="字串"

df.at["行索引值a","列索引值"]=n

在此對作者表示感謝

pandas基礎學習筆記二

二 多級索引 三 索引設定 3.set index和reset index 4.rename axis和rename 四 常用索引型函式 五 重複元素處理 六 抽樣函式 第2章 索引.ipynb 寫在前面的,按照教程中的內容都在電腦上敲了一遍 但還是感覺雲裡霧裡的。知識點很多,也有很多經驗的傳授,回...

Pandas 統計功能

dataframe 描述性統計和匯 計count 非na值的個數 describe 計算series和dataframe各列的匯 計集合 min max 計算最小值 最大值 argmin argmax 計算最小值與最大值所在的索引位置 整數 idxmin idxmax 計算最小值與最大值所在的索引標...

Pandas 日期功能

日期功能擴充套件了時間序列,在財務資料分析中起主要作用。在處理日期資料的同時,我們經常會遇到以下情況 通過指定週期和頻率,使用date.range 函式就可以建立日期序列。預設情況下,範圍的頻率是天。參考以下示例 import pandas as pd datelist pd.date range ...