import pandas as pd
import numpy as np
#建立pandas的空的series物件
s = pd.series(
)print
(s,type
(s))
#列印出series(,dtype:float64)
data = np.array(
['zs'
,'ls'
,'ww'
,'zl'])
s = pd.series(data)
print
('-'*45
)print
(s)#列印出來左邊是索引,右邊是對應的value,格式是豎著的,因為pandas核心資料型別是dateframe,所以乙個series經常表示一列資料(資料表中的一列)
#從字典建立乙個系列
data =
s = pd.series(data)
#字典的鍵變成series的索引,值是series的值
#從標量建立乙個系列
s = pd.series(
5,index=[0
,1,2
,3])
#建立乙個series,index為給series新增標籤,裡面有對應著所有index個數的 5
s = pd.series(data,index=
['001'
,'002'
,'003'
,'004'])
print
('-'*45
)print
(s)#列印出來左側豎著的的索引就改為index=裡的值了,而且修改前的索引還是能用的
s = pd.series([1
,2,3
,4,5
],index=
['a'
,'b'
,'c'
,'d'
,'e'])
#使用索引和切片訪問
print
(s[0
],s[:3
],s[-3
:])#使用標籤訪問:標籤的底層是使用字典實現的,所以使用字典取值的方式
print
(s['a'
],s[
['a'
,'c'
,'d']]
)
#pandas可以識別的日期字串格式
dates = pd.series(
['2011'
,'2011-02'
,'2011-03-01'
,'2011/04/01'
,'2011/05/01 01:01:01'
,'01 jun 2011'])
#轉換日期資料格式:to_datetime(),將日期格式轉換為:2011-01-01 00:00:00 dtype:datetime64[ns]
dates = pd.to_datetime(dates)
print
(dates)
#datetime型別資料支援日期運算
delta = dates - pd.to_datetime(
'1970-01-01'
)#獲取天數數值
print
(delta.dt.days)
pandas Series基礎使用
import numpy as np import pandas as pd from pandas import series,dataframepandas中主要有兩種資料結構,分別是 series和dataframe。series 一種類似於一維陣列的物件,是由一組資料 各種numpy資料型別...
Pandas Series缺失值補充
如何去除nan not a number dropna fillna add及fill value 當計算結果為nan時,需要用特定的值來補充代替 import pandas as pd s1 pd.series 1,2,3,4 index a b c d s2 pd.series 10,20,30...
02 pandas Series 建立 屬性
由一組資料和索引組成 資料是各種numpy資料型別 索引值可重複 使用 ndarray 建立 ran num np.random.randint 0,10,10 print ran num pd.series data,dtype,index 資料,資料型別,定義索引 pd.series ran n...