pandas的資料結構是構建在 numpy 的基礎上的,pandas 的資料結構可以分為三個級別,低階別的資料結構可以看成是高階別的的資料結構的元素,可以這樣理解,最低級別的資料結構是一維陣列,第二個級別的資料結構可以看成是二維陣列,第三個級別的資料結構可以看成是三維的陣列,當然這三個資料結構的複雜程度遠高於陣列,這三個資料結構分別是series
,dataframe
和panel
,這些資料結構的詳細如下
series 字面意思為系列
,它是乙個一維陣列,它的複雜程度在於他為一維陣列提供了很多的操作方法,便於處理這些一維資料.
建立乙個 series 物件
import
pandas
aspds1=
pd.series([1
,2,3
,4])
也可以使用多維陣列來建立series
物件,只不過他會將資料解析成一維的形式,如下
import
pandas
aspds1=
pd.series
([[1,2
,3],[2,3
,4]])
它會解析成如下形式
0[1
,2,3
]1[2
,3,4
]
其中左邊是索引,右邊是值,也就是說,無論傳多少維的陣列,他始終會將之解析成一維的形式,只不過裡面的元素會變成n-1
維而已.
series 中幾個重要的屬性
dataframe
的字面意思是資料框,從字面意思也可以看出來是乙個二維陣列,與series
類似,他應該也是被解析成乙個二維陣列
構造乙個 dataframe 物件
import
pandas
aspd
import
numpy
asnp
data_frame=pd
.dataframe
([[1,2
,3,],[4,
5,6],[7,
8,9]]
,index=[
"第一行"
,"第二行"
,"第三行"],
columns=[
"第一列"
,"第二列"
,"第三列"],
dtype=np
.int64
)data_frame
圖-1 返回的資料物件
除了常規方法構造乙個 dataframe 物件外,也可以使用字典建立乙個 dataframe 物件,這樣建立物件會將 字典中的key
作為列名,字典中的value
作為一列
??正文結束??
Pandas 快速入門
pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...
快速入門Pandas
教你十分鐘學會使用pandas。pandas是python資料分析的乙個最重要的工具。一般以pd作為pandas的縮寫 import pandas as pd 讀取檔案 df pd.read csv file.csv 返回資料的大小 df.shape 顯示資料的一些物件資訊和記憶體使用 df.inf...
pandas快速入門筆記
pandas 基於numpy,更強大,可以處理有標籤的資料 serise 帶標籤的一維陣列 import pandas as pd a pd.series 1,2,3,4,5 pd.serise 資料,標籤,型別 print a b pd.series 1,2,3,4,5 a b c d e pri...