首先載入庫
import numpy as np
import pandas as pd
python list列表建立series
a = pd.series([1,2,3,4]) #預設索引
b = pd.series([1,2,3,4],index=['a','b','c','d']) #自定義索引
s = pd.series([true,1,2.3,'a','你好']) #資料型別
標量值建立series
c = pd.series(10,index=['a','b','c']) #必須帶index
python字典建立series
d = pd.series()
ndarray建立series,索引和資料都可以通過ndarray型別生成
n = pd.series(np.arange(5))
m = pd.series(np.arange(5),index=np.arange(9,4,-1))
其他函式建立series
n = pd.series(range(10))
index和value操作
b = pd.series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
bb.index # 獲得索引,輸出index型別,就是pandas獨有的索引型別
b.values # 獲得資料,輸出型別為array,就是np的array陣列
# 索引
b['b']
b[1] # 與上面相同,自動索引是預設生成的,和自定義索引並存
b.bb[['c','d','a']]
b[['c','d',0]] #錯誤,兩套索引並存,但不能混用
# 切片
b[:'d']
b['d':]
b[:3]
b[::2]
b[::-1]
類ndarray操作
b[3] #第3個值,結果是索引的值
b[:3] #0-3,結果還是series型別
b[b > b.median()] #所有大於中位數的值
類python字典的操作
b['b']
'c' in b #判斷此鍵在不在b的索引中
0 in b #in 不會判斷自動索引
b.get('f',100) #從b中提取索引f的值,如果存在就取出,不存在就用 100 代替
根據索引對齊操作
series + series
a = pd.series([1,2,3],['c','d','e'])
b = pd.series([9,8,7,6],['a','b','c','d'])
a + b #結果為兩個值的並集,相加時索引對齊加值,索引不對齊的沒值,加完也沒值
series物件和索引都可以起乙個名字,儲存在屬性.name中
b = pd.series([9,8,7,6],['a','b','c','d'])
b.name #預設沒有
b.name = 'series物件' #物件命名
b.index.name = '索引列' #索引命名
b
series物件可以隨時修改並立即生效
b['a'] = 15
b.name = 'series'
bb.name = 'new series'
b['b','c'] = 20 # b[['b','c']] = 20
b
pandas 檢視資料的基本資訊 Series 篇
s.describe 描述性統計資訊 s.index 標籤 s.index.values 標籤 s.values 資料 s.to numpy 資料 推薦 s.head n 前n個 s.tail n 尾n個 s.memory usage 占用記憶體 位元組b s.name 名字 s.dtype 型別s...
Pandas的DataFrame資料型別
pandas的dataframe資料型別 縱軸表示不同索引axis 0,橫軸表示不同列axis 1 dataframe型別建立 1.從二維ndarray物件建立 import pandas as pd import numpy as np d pd.dataframe np.arange 10 re...
pandas 一 Series資料型別
二維資料 高維資料 series由一組資料與資料的索引組成的資料 aa pd.series 1,2,3,4,5 011 2233 445pd.series 1,2,3,4,5 index a b c d e a 1 b 2 c 3 d 4 e 5pd.series 2 index a b c a 2...