pandas資料結構

2021-08-16 00:19:15 字數 2490 閱讀 2921

# coding: utf-8

#pandas是numpy的公升級版,功能比numpy更高階

import pandas as pd

import numpy as np

# # pandas庫主要定義了兩種資料型別

# ## series

# ## dataframe

#通過乙個list列表構建乙個series資料

ser_obj = pd.series(range(1,10))

print

type(ser_obj)

print ser_obj

#series資料有兩部分組成,左側是索引,索引自動建立,右側是資料

#獲取資料

print ser_obj.values

#獲取索引

print ser_obj.index

#head()函式,提供了預覽資料的功能,預設是預覽5條資料,可以修改

print ser_obj.head()

print ser_obj.head(3)

#通過索引獲取資料

# 切片的操作

print ser_obj[2],ser_obj[1]

print ser_obj[1:6]

# 索引和資料始終保持乙個對應關係

print ser_obj + 10

print ser_obj * 10

#條件索引

print ser_obj[ser_obj>5]

# 通過字典構造series物件

#會將鍵作為索引,值作為右側的資料

year_data =

ser_obj = pd.series(year_data)

print ser_obj

print ser_obj.index

print ser_obj.values

# series物件的name屬性

ser_obj.index.name = 'year'

#給索引這一列設定name

print ser_obj

ser_obj.name = 'my_ser'

# 給ser_obj物件設定name

print ser_obj

# 自定義series物件的索引,針對列表生成的series

# index引數指定索引,索引個數和資料個數保持一致

ser_obj = pd.series(['zhangsan','lisi','wangwu'],index=['a','b','c'])

print ser_obj

ser_obj =pd.series(['30','40','50'],index=['a','b','c'],dtype='float64')

print ser_obj

# # dataframe型別

# ## series是類似於一維陣列的**形式的資料,包含左側的索引,也就是行索引

# ## dataframe是類似於多維陣列的**形式的資料,包含左側的索引成為行索引

,包含上方的索引成為列索引

#randn()生成無符號的小數

arr = np.random.randn(3,4)

print arr

print

type(arr)

arr = np.random.rand() #預設生成的是[0,1]之間的隨機浮點數

print arr

arr = np.random.rand(5)

print arr

# 通過ndarray構造dataframe物件

# columns列表定義列索引

#index列表定義行索引

df_obj = pd.dataframe(arr,columns=['a','b','c','d'],

index=['a','b','c'])

print

type(df_obj)

print df_obj

# 通過字典構造datefframe物件

dict_data =

print dict_data

# 如果字典中包含series型別的值,dataframe將採用series的index作為

dataframe的行索引,此時在dataframe中定義行索引時,

# index的值必須和series的index值保持一致,否則會導致資料丟失

df_obj = pd.dataframe(dict_data,index=['a','b','c','d'])

print df_obj

# 通過列索引獲取列資料

print df_obj['a']

print df_obj['b']

# 增加列

df_obj['g'] = 'g'

df_obj['h'] = 'h'

print df_obj

# 刪除列

del(df_obj['h'])

print df_obj

Pandas資料結構

pandas處理以下三個資料結構 這些資料結構構建在numpy陣列之上,這意味著它們很快。考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。例如,dataframe是series的容器,panel是dataframe的容器。資料結構 維數描述系列1 1d標記均勻陣列,大小不變。資...

pandas資料結構介紹

pandas是基於numpy構建的,它以numpy為中心的應用變得更加簡單。pandas的資料結構介紹 series最重要的乙個功能是 它在算術運算中會自動對齊不同索引的資料。series物件及其索引都有乙個name屬性,該屬性跟pandas其他的關鍵功能關係非常密切 series的索引可以通過賦值...

pandas資料結構 Series

series是一種類似於一維陣列的物件,由一組資料和一組對應的索引所組成。這就是個series 0 a 1 b 2 c 3 d dtype object建立乙個series 建立series的方法是使用pd.series 通過該函式可以傳入列表,字典等不同型別的物件。在傳入物件後,如果修改被傳入的物...