pandas包的使用
實際應用
關於詳解pandas常用資料結構的部落格:
pandas大全
pandas的資料型別
series:相當於numpy的一維陣列
dataframe:相當於numpy的二維陣列
屬性:shape,size,index,values
一、series
建立
1、通過一維陣列(列表或numpy)建立
n1=np.random.randint(0,5,size=5)
s1=series(n1)
print(s1)
obj2 = series([1,2,3,4],index=['a','b','c','d'])
obj2
2、通過字典建立
obj = series()
obj
索引、切片
顯式
obj.loc['a']
obj['a']
obj['a':'b']
隱式obj[0:1]
obj.iloc[0]
obj.iloc[0:1]
二、dataframe
建立
1、通過二維陣列建立
n1=np.random.randint(0,5,size=5)
n2=np.random.randint(0,5,size=5)
print(dataframe([n1,n2]))
2、通過字典建立
鍵作為行名稱
data =
frame = dataframe(data,columns=['color','object','price','weight'],
index = ['one','two','three','four','five'])
frame
索引和切片具體使用 取行
取列frame.ix[『one』]、frame.loc[『one』] 、 frame.iloc[1]
frame[『color』]、frame.color
具體資料抽取
(先使用行)
(先使用列)
frame.loc[『one』,『color』]
frame[『color』][『one』]
iloc切片
frame.iloc[1:3,:]
pandas基本使用
1、匯入csv或xlsx檔案
df = pd.dataframe(pd.read_csv('name.csv',header=1))
df = pd.dataframe(pd.read_excel('name.xlsx'))
2、pandas用法大全** python 包pandas的學習之路( )
1.開啟csv檔案使用data pandas.csv file filename 如果開啟的資料是亂碼則,在引數裡面設定下encoding 2.讀取前m行 後m行分別使用data.head m 和data.tail m 3.使用groupby sum後索引變為了multiindex不能在對其使用da...
Pandas的簡單使用
之前數學建模的時候處理了3天的資料,也是那次第一次正式使用pands,但是到今天我寫這篇部落格又過了1個月的時間,現在又對pandas有了新的認識,所以說 還是要多寫多練。其實具體來說也不是寫的很深,由於本人比較懶,還是先寫一些放在這,方便以後我使用,其實我之前有習慣就是把自己要記錄下來的東西寫下來...
Python包之Pandas介紹
前言 pandas 是乙個開源的軟體庫。dataframes和series是其兩個主要資料結構,被廣泛用於資料分析。series 是單維索引陣列,而dataframes 是具有列級和行級索引的 資料結構。pandas 是預處理資料集的絕佳工具,可提供高度優化的效能。numpy介紹 下面是詳細介紹 用...