Pandas庫的Series資料型別及其操作詳解

2021-10-02 01:14:51 字數 3472 閱讀 1399

series資料型別:有一組一維陣列和索引組成

1.0 自動索引

如下**所示:當只給定值,不給定索引的時候,系統將會自動補齊索引

>>

>

import pandas as pd

>>

> a=pd.series([1

,2,3

,4])

>>

> a01

1223

34dtype: int64

2.0 自定義索引

如下**所示:給定倆組資料,前者表示值,後者表示自定義索引

>>

> b=pd.series([5

,6,7

,8],

['a'

,'b'

,'c'

,'d'])

>>

> b

a 5

b 6

c 7

d 8

dtype: int64

3.0 可以用以下型別建立series型別

3.1 使用標量值

使用標量值的時候,索引值給定後,標量將會根據索引填充

>>

> c=pd.series(

25,index=

['a'

,'b'

,'c'])

>>

> c

a 25

b 25

c 25

dtype: int64

3.2 使用字典型別

字典型別相當於鍵值對

>>

> d=pd.series(

)>>

> d

a 8

b 5

dtype: int64

3.3 ndarray,相當於將ndarray的值分別賦給索引和值

>>

>

import numpy as np

>>

> e=pd.series(np.arange(5)

)#還可以給定index=np.arange()給定索引

>>

> e00

1122

3344

dtype: int32

4.0 series基本操作(類ndarray型別)

4.1 對其的索引和值進行輸出及檢視其型別

>>

> b.index

index(

['a'

,'b'

,'c'

,'d'

], dtype=

'object'

)>>

> b.values

array([5

,6,7

,8], dtype=int64)

4.2 使用索引檢視值,可以使用自動索引,也可以使用自定義索引

>>

> b[

'a']

5>>

> b[1]

6>>

> b[

['a'

,'b',0

]]#倆種索引不能混用

a 5.0

b 6.0

0 nan

dtype: float64

4.3 切片操作

如下**所示:與其他的切片同理,

>>

> b[:2

]a 5

b 6

dtype: int64

4.4 使用部分函式操作,如下**所示:

>>

> b[b>b.median()]

#中位數函式

c 7

d 8

dtype: int64

5.0 series基本操作(類字典型別)

5.1 字典索引:索引鍵

>>

> b[

'a']

5

5.2 in 關鍵字

使用該關鍵字獲取的判斷是使用該值和series中索引進行判斷

>>

>

8in b

false

>>

>

2in b

false

>>

>

'a'in b

true

5.3 get()函式

當存在該索引時,返回該索引對應的值,反之,返回get函式裡面的引數

>>

> b.get(

'f',36)

36>>

> b.get(

'a',36)

5

6.0 series資料的運算

這是基於索引的運算,當有一方不存在該索引對應的值,則會返回nan

>>

> a=pd.series([1

,2,3

],['c'

,'d'

,'e'])

>>

> a

c 1

d 2

e 3

dtype: int64

>>

> b

a 5

b 6

c 7

d 8

dtype: int64

>>

> a+b

a nan

b nan

c 8.0

d 10.0

e nan

dtype: float64

7.0 name屬性

該屬性隨時修改並立即生效

>>

> b.name

>>

> b.name=

'serise資料'

>>

> b.name

'serise資料'

>>

> b.index.name=

'列名'

>>

> b

列名a 5

b 6

c 7

d 8

name: serise資料, dtype: int64

8.0 series實質上是一維帶「標籤」的陣列

Pandas庫的使用 Series

一。概念 series相當於一維陣列。1.呼叫series的原生方法建立 import pandas as pd s1 pd.series data 1,2,4,6,7 index a b c d e index表示索引 print s1 a print s1 0 print s1 3 在serie...

Pandas庫介紹 Series資料型別

pandas是python的第三方庫,提供高效能易用資料型別和分析工具。提供適合分析的資料型別 提供分析資料的函式 pandas是基於numpy實現的 import pandas as pd d pd.series range 20 print d d.cumsum 計算前n項的累加和 輸出結果 0...

pandas中的Series物件

series和dataframe是pandas中最常用的兩個物件 1。可以用numpy的陣列處理函式直接對series物件進行處理 2。支援使用位置訪問元素,使用索引標籤作為下標訪問元素 每個series物件實際上都是由兩個陣列組成 1 index 從ndarray陣列繼承的index索引物件,儲存...