numpy 相當於序列化好的矩陣
pandas:相當於字典
0.1:series類似於numpy中的一維陣列,除了通吃一維陣列可用的函式或方法,而且其可通過索引標籤的方式獲取資料,還具有索引的自動對齊功能
0.2:dataframe類似於numpy中的二維陣列,同樣可以通用numpy陣列的函式和方法,而且還具有其他靈活應用,後續會介紹到。
1)通過一維陣列建立序列
2)通過字典的方式建立序列
3)二者區別:使用陣列建立的series,索引使用012345...;使用字典建立的series,索引使用字典的key。
4)通過dataframe中的某一行或某一列建立序列
1)通過二維陣列建立資料框
2)通過字典的方式建立資料框
以下以兩種字典來建立資料框,乙個是字典列表(字典裡面套list),乙個是巢狀字典(字典裡面套字典)。
3)通過資料框的方式建立資料框(擷取已有的dataframe一部分)
1 pd.dataframe(矩陣a,index = listb, columns = listc)
——返回:建立乙個dataframe格式的矩陣,
矩陣內容是:引數矩陣a
行索引名稱:引數listb
列索引名稱:引數listc
注:行索引index、列索引columns不給定時,輸出的行列的索引都預設為0123.....
1 pd.dataframe()
————使用字典,每一item 是 每一列的元素
——返回,每一列的資料形式
——返回,每一行的索引序號
——返回,每一列的索引序號
——返回,乙個有同樣元素的不帶有行列序號的矩陣
count:非空元素個數
sum:求和
mean:平均值
median:中位數
mode:眾數
var:方差
std:標準差
mad:平均絕對偏差
min:最小值
quantile(0.1) :10%分位數
max:最大值
idxmin() :最小值的位置
idxmax():最大值的位置
skew:偏度
kurt:峰度
describe:一次性輸出多個描述性統計指標,必須注意的是,descirbe方法只能針對序列或資料框,一維陣列是沒有這個方法的
dataframe變數名.t
eg:df1.t
3.7.1 sort_index()——根據行或者列索引序號,對矩陣進行排序
1 dataframe變數名.sort_index(axis = ...., ascending = true/false)
——引數:
axis = 0 根據行索引序號,對所有行進行排序
axis = 1 對列進行排序
ascending = true/false true:正序排列;false:倒敘排序
3.7.2 sort_value()——對某一行/列,按照元素大小進行排序
1 dataframe變數名.sort_values(by = 引數a)
——引數a:行索引/列索引序號,對哪一行/列進行排序,就輸,該行/列的索引序號。
pandas使用技巧總結 1
記錄工作中使用過的一些pandas技巧 匯入必要的庫 並設定路徑 對得到資料預處理 cs well data 壓裂段 str.split n 2,expand true 壓裂段形式 井號 層號 段號 str.split 對應list.split 以什麼分割,預設空格,n 分成幾段,預設 1 all ...
Pandas 快速入門
pandas其實很簡單,共有三種資料結構。其中一維為series,二維為dataframe,三維為panel.先說series,numpy陣列,python列表等都可以生成series。它的結構分為兩部分,索引和值。獲取索引的方式為 index 方法,獲取值得方式為values 方法。而資料框又多乙...
pandas入門 十一
跟series中的值一樣,軸標籤也可以通過函式或對映進行轉換,從而得到乙個新的不同標籤的物件。軸還可以被就地修改,而無需新建乙個資料結構。跟series一樣,軸索引也有乙個map方法 將其賦值給index,這樣就可以對dataframe進行就地修改 想要建立資料集的轉換版 而不是修改原始資料 比較實...