git 上pandas學習教程,共有十章、4個板塊:pandas基礎、四類操作、四類資料、例子。原文內容系統的講解了pandas庫的使用方法,編排邏輯易懂,覆蓋面廣且含有相應練習,之前已經學習過pandas,但是感覺應用時有些費力,計畫重新按照學習教程再梳理一遍,爭取10天完成學習,enjoy time.
**如下:
1.pandas基礎.ipynb
119k
·series和dataframe有哪些常見屬性和方法?
series 常用 values、index、name、dtype2. value_counts會統計缺失值嗎?dataframe 常用values、index、columns、dtype、shape、mean
value_counts 返回元素和元素數量,不統計缺失值3. 如果有多個索引同時取到最大值,idxmax會返回所有這些索引嗎?如果不會,那麼怎麼返回這些索引?
不會,只會返回其中的最小索引值4. 在常用函式一節中,由於一些函式的功能比較簡單,因此沒有列入,現在將它們列在下面,請分別說明它們的用途並嘗試使用。
df.sum () 求和 (axis=0 按列計算,axis=1 按行計算,預設axis=0)5. df.mean(axis=1)是什麼意思?它與df.mean()的結果一樣嗎?問題四提到的函式也有axis引數嗎?怎麼使用?df.mean() 平均值
df.median () 中位數
df.mad() 根據平均值計算平均絕對偏差
df.min() 最小值
df.max() 最大值
df.abs() 絕對值
df.std() 標準差
df.var() 方差
df.quantile () 計算分位數
df.cummax() 返回軸上的累積最大值
df.cumsum () 返回dataframe軸上的累積和
df.cumprod() 返回dataframe軸上的累積乘積
對資料行求平均數,df.mean()預設axis=0,對資料列求平均數6. 對值進行排序後,相同的值次序由什麼決定?axis=0對列操作,axis=1對行操作, 預設axis=0
相同的值,按索引小→大排序7. pandas中為各類基礎運算也定義了函式,比如s1.add(s2)表示兩個series相加,但既然已經有了'+',是不是多此一舉?
add不僅可以相加而且可以設定相關引數
Pandas更改列型別
複習用 單列 pd.to numeric df 0 多列 df 0,1 pd.to numeric 有無效值報錯 df 0,1 pd.to numeric,errors coerce 無效值轉換成nan df 0,1 pd.to numeric,errors ignore 有無效值取消操作 轉換為日...
pandas對列求和
使用pandas把列表中的字典元素轉成二維陣列,然後使用pandas函式實現對每一列求和。import pandas as pd datas sum dict pd.dataframe datas drop columns 學生 fillna 0 lambda x round x.sum 2 if ...
pandas 第一列 pandas筆記(一)
最近在學習pandas,在這裡記錄一下筆記。一 建立pandas二維陣列 import pandas as pdimport numpy as nps pd.date range 20200101 periods 6 df pd.dataframe np.random.randn 6,4 index...