pandas入門總結1

2022-03-08 07:50:40 字數 1636 閱讀 1352

numpy 相當於序列化好的矩陣

pandas:相當於字典

0.1:series類似於numpy中的一維陣列,除了通吃一維陣列可用的函式或方法,而且其可通過索引標籤的方式獲取資料,還具有索引的自動對齊功能

0.2:dataframe類似於numpy中的二維陣列,同樣可以通用numpy陣列的函式和方法,而且還具有其他靈活應用,後續會介紹到。

1)通過一維陣列建立序列

2)通過字典的方式建立序列

3)二者區別:使用陣列建立的series,索引使用012345...;使用字典建立的series,索引使用字典的key。

4)通過dataframe中的某一行或某一列建立序列

1)通過二維陣列建立資料框

2)通過字典的方式建立資料框

以下以兩種字典來建立資料框,乙個是字典列表(字典裡面套list),乙個是巢狀字典(字典裡面套字典)。

3)通過資料框的方式建立資料框(擷取已有的dataframe一部分)

1 pd.dataframe(矩陣a,index = listb, columns = listc)

——返回:建立乙個dataframe格式的矩陣,

矩陣內容是:引數矩陣a

行索引名稱:引數listb

列索引名稱:引數listc

注:行索引index、列索引columns不給定時,輸出的行列的索引都預設為0123.....

1 pd.dataframe()

————使用字典,每一item 是 每一列的元素

——返回,每一列的資料形式

——返回,每一行的索引序號

——返回,每一列的索引序號

——返回,乙個有同樣元素的不帶有行列序號的矩陣

count:非空元素個數

sum:求和

mean:平均值

median:中位數

mode:眾數

var:方差

std:標準差

mad:平均絕對偏差

min:最小值

quantile(0.1) :10%分位數

max:最大值

idxmin() :最小值的位置

idxmax():最大值的位置

skew:偏度

kurt:峰度

describe:一次性輸出多個描述性統計指標,必須注意的是,descirbe方法只能針對序列或資料框,一維陣列是沒有這個方法的

dataframe變數名.t

eg:df1.t

3.7.1  sort_index()——根據行或者列索引序號,對矩陣進行排序

1 dataframe變數名.sort_index(axis = ...., ascending = true/false)

——引數:

axis = 0 根據行索引序號,對所有行進行排序

axis = 1 對列進行排序

ascending = true/false true:正序排列;false:倒敘排序

3.7.2 sort_value()——對某一行/列,按照元素大小進行排序

1 dataframe變數名.sort_values(by = 引數a)

——引數a:行索引/列索引序號,對哪一行/列進行排序,就輸,該行/列的索引序號。

pandas使用技巧總結 1

記錄工作中使用過的一些pandas技巧 匯入必要的庫 並設定路徑 對得到資料預處理 cs well data 壓裂段 str.split n 2,expand true 壓裂段形式 井號 層號 段號 str.split 對應list.split 以什麼分割,預設空格,n 分成幾段,預設 1 all ...

Pandas 快速入門

pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...

pandas入門 十一

跟series中的值一樣,軸標籤也可以通過函式或對映進行轉換,從而得到乙個新的不同標籤的物件。軸還可以被就地修改,而無需新建乙個資料結構。跟series一樣,軸索引也有乙個map方法 將其賦值給index,這樣就可以對dataframe進行就地修改 想要建立資料集的轉換版 而不是修改原始資料 比較實...