Pandas (1)基礎資料結構概念和建立

2021-10-07 07:25:10 字數 3398 閱讀 2273

二、series 資料結構

三、dataframe資料結構

打賞

series 是帶有標籤的一維陣列,可以儲存任何資料型別(整數,字串,浮點數,python物件等),軸標籤統稱為索引

s = pd.series(np.random.rand(5)

)print

(s)print

(type

(s))

# 檢視資料、資料型別

print

(s.index,

type

(s.index)

)print

(s.values,

type

(s.values)

)# .index檢視series索引,型別為rangeindex

# .values檢視series值,型別是ndarray

核心:series相比於ndarray,是乙個自帶索引index的陣列 → 一維陣列 + 對應索引

所以當只看series的值的時候,就是乙個ndarray。 series和ndarray較相似,索引切片功能差別不大 series和dict相比,series更像乙個有順序的字典(dict本身不存在順序),其索引原理與字典相似(乙個用key,乙個用index)

字典的key就是index,values就是values

dic =

s = pd.series(dic)

arr = np.random.randn(5)

s = pd.series(arr)

# 預設index是從0開始,步長為1的數字

# 也可以自己設定index,dtype和 name引數

s = pd.series(arr, index =

['a'

,'b'

,'c'

,'d'

,'e'

],dtype = np.

object

, name =

'test'

)# index引數:設定index,長度保持一致

# dtype引數:設定數值型別

# name為series的乙個引數,建立乙個陣列的名稱,格式為str,如果沒用定義輸出名稱,輸出為none

重新命名

# .rename()重新命名乙個陣列的名稱,並且新指向乙個陣列,原陣列不變

s2 = s.rename(

'hehehe'

)

"二維陣列"dataframe:是乙個**型的資料結構,「帶有標籤的二維陣列」。包含一組有序的列,其列的值型別可以是數值、字串、布林值等。

dataframe中的資料以乙個或多個二維塊存放,dataframe帶有index(行標籤)和columns(列標籤)(不是列表、字典或一維陣列結構。)

data =

frame = pd.dataframe(data)

print

(frame'\n該資料型別為:'

,type

(frame)

)# 檢視資料,資料型別為dataframe

print

(frame.index,

'\n該資料型別為:'

,type

(frame.index)

)# .index檢視行標籤

print

(frame.columns,

'\n該資料型別為:'

,type

(frame.columns)

)# .index檢視行標籤

print

(frame.values,

'\n該資料型別為:'

,type

(frame.values)

)# .values檢視值,資料型別為ndarray

# to_list()資料型別轉換成列表

frame.index.to_list(

)frame.columns.to_list(

)frame.values.to_list(

)

# 由陣列/list組成的字典 建立dataframe,columns為字典key,index為預設數字標籤

# 字典的值的長度必須保持一致!

data1 =

data2 =

# 這裡如果嘗試 'two':np.random.rand(4) 會怎麼樣?

df1 = pd.dataframe(data1)

df2 = pd.dataframe(data2)

# 和series一樣也可以自己設定引數值

df1 = pd.dataframe(data1, columns =

['b'

,'c'

,'a'

,'d'])

df2 = pd.dataframe(data2, index =

['f1'

,'f2'

,'f3'

])

data1 =

# 沒有設定index的series

data2 =

# 設定了index的series

df1 = pd.dataframe(data1)

df2 = pd.dataframe(data2)

ar = np.random.rand(9)

.reshape(3,

3)df2 = pd.dataframe(ar, index =

['a'

,'b'

,'c'

], columns =

['one'

,'two'

,'three'])

# 可以嘗試一下index或columns長度不等於已有陣列的情況

碼字不易,如果對您有幫助,就打賞一下吧o(∩_∩)o

資料結構 基礎概念

資料 描述客觀事物的數值,字元以及能輸入到計算機中且能被處理的各種符號集合。資料元素 由乙個或多個資料項 資料的最小單位 組成,是資料集合的個體,在計算機中通常作為乙個整體進行考慮。資料型別 一組性質相同的值集合以及定義在這個值集合上的一組操作的總稱。資料結構 互相之間存在一種或多種特定關係的資料元...

資料結構基礎概念

概念術語 資料 data 是對客觀事物的符號表示,在電腦科學中是指所有能輸入到計算機中並被電腦程式處理的符號的總稱。資料元素 data element 是資料的基本單位,在電腦程式中通常作為乙個整體進行考慮和處理。有時乙個資料元素可由若干個資料項 data item 組成,例如一本書的書目資訊為乙個...

pandas 1 Series資料結構

import numpy as np import pandas as pd from pandas import series 1.建立乙個有預設索引的series,series是一種類似與一維陣列的物件,它由一組資料 各種numpy資料型別 以及一組與之相關的資料標籤 即索引 組成 obj se...