pandas入門總結1

numpy 相當於序列化好的矩陣

pandas：相當於字典

0.1：series類似於numpy中的一維陣列，除了通吃一維陣列可用的函式或方法，而且其可通過索引標籤的方式獲取資料，還具有索引的自動對齊功能

0.2：dataframe類似於numpy中的二維陣列，同樣可以通用numpy陣列的函式和方法，而且還具有其他靈活應用，後續會介紹到。

1）通過一維陣列建立序列

2）通過字典的方式建立序列

3）二者區別：使用陣列建立的series，索引使用012345...；使用字典建立的series，索引使用字典的key。

4）通過dataframe中的某一行或某一列建立序列

1）通過二維陣列建立資料框

2）通過字典的方式建立資料框

以下以兩種字典來建立資料框，乙個是字典列表（字典裡面套list），乙個是巢狀字典（字典裡面套字典）。

3）通過資料框的方式建立資料框（擷取已有的dataframe一部分）

1 pd.dataframe(矩陣a，index = listb， columns = listc)

——返回：建立乙個dataframe格式的矩陣，

矩陣內容是：引數矩陣a

行索引名稱：引數listb

列索引名稱：引數listc

注：行索引index、列索引columns不給定時，輸出的行列的索引都預設為0123.....

1 pd.dataframe()

————使用字典，每一item 是每一列的元素

——返回，每一列的資料形式

——返回，每一行的索引序號

——返回，每一列的索引序號

——返回，乙個有同樣元素的不帶有行列序號的矩陣

count：非空元素個數

sum：求和

mean：平均值

median：中位數

mode：眾數

var：方差

std：標準差

mad：平均絕對偏差

min：最小值

quantile(0.1) ：10%分位數

max：最大值

idxmin() ：最小值的位置

idxmax()：最大值的位置

skew：偏度

kurt：峰度

describe：一次性輸出多個描述性統計指標，必須注意的是，descirbe方法只能針對序列或資料框，一維陣列是沒有這個方法的

dataframe變數名.t

eg:df1.t

3.7.1 sort_index()——根據行或者列索引序號，對矩陣進行排序

1 dataframe變數名.sort_index(axis = ...., ascending = true/false)

——引數：

axis = 0 根據行索引序號，對所有行進行排序

axis = 1 對列進行排序

ascending = true/false true：正序排列；false：倒敘排序

3.7.2 sort_value()——對某一行/列，按照元素大小進行排序

1 dataframe變數名.sort_values(by = 引數a)

——引數a：行索引/列索引序號，對哪一行/列進行排序，就輸，該行/列的索引序號。

pandas使用技巧總結 1

記錄工作中使用過的一些pandas技巧匯入必要的庫並設定路徑對得到資料預處理 cs well data 壓裂段 str.split n 2,expand true 壓裂段形式井號層號段號 str.split 對應list.split 以什麼分割，預設空格，n 分成幾段，預設 1 all ...

Pandas 快速入門

pandas其實很簡單，共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series，numpy陣列，python列表等都可以生成series。它的結構分為兩部分，索引和值。獲取索引的方式為 index 方法，獲取值得方式為values 方法。而資料框又多乙...

pandas入門十一

跟series中的值一樣，軸標籤也可以通過函式或對映進行轉換，從而得到乙個新的不同標籤的物件。軸還可以被就地修改，而無需新建乙個資料結構。跟series一樣，軸索引也有乙個map方法將其賦值給index，這樣就可以對dataframe進行就地修改想要建立資料集的轉換版而不是修改原始資料比較實...

pandas入門總結1

pandas使用技巧總結 1

Pandas 快速入門

pandas入門 十一

相關推薦

pandas入門十一