Python中的Pandas模組

2021-08-29 01:46:30 字數 2942 閱讀 7829

目錄

pandas

series

序列的建立

序列的讀取 

dataframe

dataframe的建立 

dataframe資料的讀取

panel

panel的建立 

pandas( python data analysis library )是基於numpy 的一種工具,該工具是為了解決資料分析任務而建立的。pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。你很快就會發現,它是使python成為強大而高效的資料分析環境的重要因素之一

python中有三種資料結構

series:一維陣列,與numpy中的一維array類似。二者與python基本的資料結構list也很相近,其區別是:list中的元素可以是不同的資料型別,而array和series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。time- series:以時間為索引的series。

dataframe:二維的**型資料結構。很多功能與r中的data.frame類似。可以將dataframe理解為series的容器。dataframe是用的最多的資料結構

panel :三維的陣列,可以理解為dataframe的容器。

pandas可以讀取很多種的資料,用的比較多的是讀取 htm、json、csv的資料

import pandas

data1=pandas.read_html('1.html') #讀取html格式資料

data2=pandas.read_json('2.json') #讀取json格式資料

data3=pandas.read_csv('3.csv') #讀取csv格式的資料

系列(series)是能夠儲存任何型別的資料(整數,字串,浮點數,python物件等)的一維標記陣列。軸標籤統稱為索引

series的建立函式:pandas.series( data, index, dtype,copy )

引數描述

data

資料採取各種形式,如:ndarray,list,constants

index

索引值必須是唯一的和雜湊的,與資料的長度相同。預設 np.arange(n) 如果沒有索引被傳遞

dtype

dtype 使用者資料型別。如果沒有,將推斷資料型別

copy

複製資料,預設為 false

建立乙個空series序列

從字典建立乙個series序列

讀取直接用 ['行名'],序列只可以讀取行的內容

資料幀(dataframe)是二維資料結構,即資料以行和列的**方式排列。

資料幀(dataframe)的功能特點:

dataframe的建立函式:pandas.dataframe( data, index, columns, dtype, copy) 引數

描述data

資料採取各種形式,如:ndarray,series,map,lists,dict,constant和另乙個dataframe

index

對於行標籤,要用於結果幀的索引是可選預設值 np.arrange(n) ,如果沒有傳遞索引值

columns

對於列標籤,可選的預設語法是 np.arange(n) 這只有在沒有索引傳遞的情況下才是這樣

dtype

每列的資料型別

copy

如果預設值為false,則此命令用於複製資料

建立乙個空dataframe序列

從字典建立乙個series序列(必須加index)

讀取列,直接 ['列名']

讀取行 

面板(panel)是3d容器的資料。面板資料一詞**於計量經濟學,部分源於名稱:pandas - pan(el)-da(ta)-s。

3軸(axis)這個名稱旨在給出描述涉及面板資料的操作的一些語義。它們是 

panel的建立函式:pandas.panel(data, items, major_axis, minor_axis, dtype, copy) 引數

說明data

資料採取各種形式,如:ndarray,series,map,lists,dict,constant和另乙個資料幀 dataframe

items

axis=0

major_axis

axis=1

minor_axis

axis=2

dtype

每列的資料型別

copy

複製資料,預設 false

建立乙個空panel序列

python怎麼取模 Python中的取模運算方法

所謂取模運算,就是計算兩個數相除之後的餘數,符號是 如a b就是計算a除以b的餘數。用數學語言來描述,就是如果存在整數n和m,其中0 m b,使得a n b m,那麼a b a n b m.取模運算的兩個運算元都必須是整數,可以是負整數,但是b不可以是0,因為被除數不能為0嘛。當a和b中存在負整數時...

Python中的numpy linalg模組

線性代數 numpy.linalg模組包含線性代數的函式。使用這個模組,可以計算逆矩陣 求特徵值 解線性方程組以及求解行列式等。import numpy as np 1.計算逆矩陣 建立矩陣 a np.mat 0 1 2 1 0 3 4 3 8 print a 0 1 2 1 0 3 4 3 8 使...

python中的取模

這周展開了對python的學習,在學習運算子中對於取模符號 時出現了疑惑,特此記錄。在c語言中,符號表示的是求餘運算,而在python指令碼中,表示的是取模。通常取模運算中除數不允許是負數,但是在python 2.5.1裡可以在 後面跟負數,因為python語言中除法的結果是向無窮小方向捨入,因此計...