# coding: utf-8#pandas是numpy的公升級版,功能比numpy更高階
import pandas as pd
import numpy as np
# # pandas庫主要定義了兩種資料型別
# ## series
# ## dataframe
#通過乙個list列表構建乙個series資料
ser_obj = pd.series(range(1,10))
type(ser_obj)
print ser_obj
#series資料有兩部分組成,左側是索引,索引自動建立,右側是資料
#獲取資料
print ser_obj.values
#獲取索引
print ser_obj.index
#head()函式,提供了預覽資料的功能,預設是預覽5條資料,可以修改
print ser_obj.head()
print ser_obj.head(3)
#通過索引獲取資料
# 切片的操作
print ser_obj[2],ser_obj[1]
print ser_obj[1:6]
# 索引和資料始終保持乙個對應關係
print ser_obj + 10
print ser_obj * 10
#條件索引
print ser_obj[ser_obj>5]
# 通過字典構造series物件
#會將鍵作為索引,值作為右側的資料
year_data =
ser_obj = pd.series(year_data)
print ser_obj
print ser_obj.index
print ser_obj.values
# series物件的name屬性
ser_obj.index.name = 'year'
#給索引這一列設定name
print ser_obj
ser_obj.name = 'my_ser'
# 給ser_obj物件設定name
print ser_obj
# 自定義series物件的索引,針對列表生成的series
# index引數指定索引,索引個數和資料個數保持一致
ser_obj = pd.series(['zhangsan','lisi','wangwu'],index=['a','b','c'])
print ser_obj
ser_obj =pd.series(['30','40','50'],index=['a','b','c'],dtype='float64')
print ser_obj
# # dataframe型別
# ## series是類似於一維陣列的**形式的資料,包含左側的索引,也就是行索引
# ## dataframe是類似於多維陣列的**形式的資料,包含左側的索引成為行索引
,包含上方的索引成為列索引
#randn()生成無符號的小數
arr = np.random.randn(3,4)
print arr
type(arr)
arr = np.random.rand() #預設生成的是[0,1]之間的隨機浮點數
print arr
arr = np.random.rand(5)
print arr
# 通過ndarray構造dataframe物件
# columns列表定義列索引
#index列表定義行索引
df_obj = pd.dataframe(arr,columns=['a','b','c','d'],
index=['a','b','c'])
type(df_obj)
print df_obj
# 通過字典構造datefframe物件
dict_data =
print dict_data
# 如果字典中包含series型別的值,dataframe將採用series的index作為
dataframe的行索引,此時在dataframe中定義行索引時,
# index的值必須和series的index值保持一致,否則會導致資料丟失
df_obj = pd.dataframe(dict_data,index=['a','b','c','d'])
print df_obj
# 通過列索引獲取列資料
print df_obj['a']
print df_obj['b']
# 增加列
df_obj['g'] = 'g'
df_obj['h'] = 'h'
print df_obj
# 刪除列
del(df_obj['h'])
print df_obj
Pandas資料結構
pandas處理以下三個資料結構 這些資料結構構建在numpy陣列之上,這意味著它們很快。考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。例如,dataframe是series的容器,panel是dataframe的容器。資料結構 維數描述系列1 1d標記均勻陣列,大小不變。資...
pandas資料結構介紹
pandas是基於numpy構建的,它以numpy為中心的應用變得更加簡單。pandas的資料結構介紹 series最重要的乙個功能是 它在算術運算中會自動對齊不同索引的資料。series物件及其索引都有乙個name屬性,該屬性跟pandas其他的關鍵功能關係非常密切 series的索引可以通過賦值...
pandas資料結構 Series
series是一種類似於一維陣列的物件,由一組資料和一組對應的索引所組成。這就是個series 0 a 1 b 2 c 3 d dtype object建立乙個series 建立series的方法是使用pd.series 通過該函式可以傳入列表,字典等不同型別的物件。在傳入物件後,如果修改被傳入的物...