pandas是python的核心資料分析支援庫,提供了快速、靈活、明確的資料結構,旨在簡單、直觀的處理關係型、資料型的資料。
pandas適用於處理以下型別的資料:
維數名稱描述1
series
帶標籤的一維同構陣列
2dataframe
帶標籤的,大小可變的,二維異構**
pandas資料結構就像是低維資料的容器。比如,dataframe是series的容器,series則是標量的容器。使用這種方式,可以在容器中以字典的形式插入或刪除物件。
處理dataframe等**資料時,index(行)或columns(列)比axis 0和axis 1更加直觀。用這種方式迭代dataframe的列,**更易讀易懂。
pandas所有的for col in df.columns:
series = df[col]
# do something with series
資料結構的值
都是可變
的,但資料結構的大小
並非都是可變
的,比如,series的長度不可改變,但dataframe裡就可以插入列。
pandas裡,絕大多數方法都不改變原始的輸入資料,而是複製資料,生成新的物件。一般說,原始輸入資料不變更穩妥。
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...
pandas學習筆記
1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...
pandas學習筆記
1.series 類似numpy中的一維陣列,表示為索引 從0開始 和值。建立 import pandas as pd,numpy as np s1 pd.series np.arange 10 s2 pd.series 12 2,5 s3 pd.series 含有的屬性 s1.values s1....