pandas包的使用

2021-09-16 13:20:26 字數 1610 閱讀 4379

pandas包的使用

實際應用

關於詳解pandas常用資料結構的部落格:

pandas大全

pandas的資料型別

series:相當於numpy的一維陣列

dataframe:相當於numpy的二維陣列

屬性:shape,size,index,values

一、series

建立

1、通過一維陣列(列表或numpy)建立

n1=np.random.randint(0,5,size=5)

s1=series(n1)

print(s1)

obj2 = series([1,2,3,4],index=['a','b','c','d'])

obj2

2、通過字典建立

obj = series()

obj

索引、切片

顯式

obj.loc['a']

obj['a']

obj['a':'b']

隱式obj[0:1]

obj.iloc[0]

obj.iloc[0:1]

二、dataframe

建立

1、通過二維陣列建立

n1=np.random.randint(0,5,size=5)

n2=np.random.randint(0,5,size=5)

print(dataframe([n1,n2]))

2、通過字典建立

鍵作為行名稱

data = 

frame = dataframe(data,columns=['color','object','price','weight'],

index = ['one','two','three','four','five'])

frame

索引和切片具體使用 取行

取列frame.ix[『one』]、frame.loc[『one』] 、 frame.iloc[1]

frame[『color』]、frame.color

具體資料抽取

(先使用行)

(先使用列)

frame.loc[『one』,『color』]

frame[『color』][『one』]

iloc切片

frame.iloc[1:3,:]

pandas基本使用

1、匯入csv或xlsx檔案

df = pd.dataframe(pd.read_csv('name.csv',header=1))

df = pd.dataframe(pd.read_excel('name.xlsx'))

2、pandas用法大全**

python 包pandas的學習之路( )

1.開啟csv檔案使用data pandas.csv file filename 如果開啟的資料是亂碼則,在引數裡面設定下encoding 2.讀取前m行 後m行分別使用data.head m 和data.tail m 3.使用groupby sum後索引變為了multiindex不能在對其使用da...

Pandas的簡單使用

之前數學建模的時候處理了3天的資料,也是那次第一次正式使用pands,但是到今天我寫這篇部落格又過了1個月的時間,現在又對pandas有了新的認識,所以說 還是要多寫多練。其實具體來說也不是寫的很深,由於本人比較懶,還是先寫一些放在這,方便以後我使用,其實我之前有習慣就是把自己要記錄下來的東西寫下來...

Python包之Pandas介紹

前言 pandas 是乙個開源的軟體庫。dataframes和series是其兩個主要資料結構,被廣泛用於資料分析。series 是單維索引陣列,而dataframes 是具有列級和行級索引的 資料結構。pandas 是預處理資料集的絕佳工具,可提供高度優化的效能。numpy介紹 下面是詳細介紹 用...