pandas中的資料結構主要包括兩種,一種是series,一種是dataframe。
series表示一維資料,可以簡單理解為乙個向量,但是不同於向量的是,series會自動為這一維資料建立行索引。
① 建立series
import pandas as pd
series_obj = pd.series(['a','b','c'])
② series本身的屬性有兩種,一種是index,一種是values
series_obj.index
# 檢視series的index
series_obj.values
# 檢視series的values
③ 檢視series的前幾行
series_obj.head(1) # 可以將1替換成想檢視的任何行數
dataframe是一種**型的資料結構,既有行索引index,也有列索引columns。其實可以簡單把dataframe理解為一張資料表。
① 建立dataframe
通過字典方式建立, key相當於列索引中的每一列的「列名」
data_dict =
print(data_dict)
通過無索引的資料矩陣,新增columns
a = [[1,2,3],[2,3,4]]
data = pd.dataframe(a,columns=('a','b','c'))
② 同樣地,對於pandas來說,有三種屬性可以呼叫,一是index,二是columns,三是values
③ dataframe的索引問題
按照欄位名稱選列
data['a'] # 找出一列
data[['a','b']] # 找出兩列或多列資料
按照字段位置選列和行
data.loc[0,:] # 找出某一行的資料
data.loc[[0,1],:] # 找出一二行的資料
找出dataframe的前/後多少行
data.head(2) # 前兩行
data.tail(2) # 後兩行
④ dataframe的排序問題
data2 = data.sort_index(ascending=false)
data3 = data.sort_values(by='b',ascending=true)
⑤ dataframe的資料新增與刪除
data['d'] = [4,2]
deldata['d']
⑥ dataframe用於資料探索
data.info()
data.describe()
兩種基本的資料結構
棧的基本操作包括入棧push和出棧pop,棧有乙個棧頂指標top,指向最新如棧的元素,入棧和出棧操作操作都是從棧頂端進行的。佇列的基本操作包括入隊enqueue和出隊dequeue,佇列有隊頭head和隊尾tail指標。元素總是從隊頭出,從隊尾入。採用陣列實現佇列時候,為了合理利用空間,可以採用迴圈...
資料結構 兩種常見的查詢演算法
查詢是在大量的資訊中尋找乙個特定的資訊元素,在計算機應用中,查詢是常用的基本運算 順序查詢演算法 演算法思想 演算法實現演算法的c 實現,實現 來自王治和教授資料結構課堂的總結 enum error code error code sequentialsearch int entry,int siz...
Mysql兩種主要資料引擎的區別
innodb和myisam是在使用mysql最常用的兩個表型別,它們各有各的優點,視具體應用而定。innodb引擎 該引擎在5.5後的mysql資料庫中為預設儲存引擎。innodb引擎提供了對資料庫acid事務的支援,並且實現了sql標準的四種隔離級別。該引擎還提供了行級鎖和外來鍵約束,它的設計目標...