資料分析 pandas 3

2021-09-27 13:55:21 字數 2611 閱讀 7188

dataframe和series的關係

傳入字典建立dataframe

dataframe的方法

在資料分析-pandas(2)的時候,我們簡單的講解了一下關於dataframe的橫向索引index和縱向索引columns,他們預設是從0開始的,現在我們來學習一下,如何建立特定的indexcolumns

#匯入pandas包

in [2]

:import pandas as pd

#匯入numpy包

in [3]

:import numpy as np

#生成dataframe矩陣資料表

in [4]

: t = pd.dataframe(np.arange(1,

13).reshape(3,

4))#得到結果

in [5]

: tout[5]

:012

3012

3415

6782

9101112

#建立特定的index和columns的dataframe

in [6]

: t = pd.dataframe(np.arange(1,

13).reshape(3,

4),index=

["a"

,"b"

,"c"

],columns=

["w"

,"x"

,"y"

,"z"])

#輸出列印 t

in [7]

: tout[7]

: w x y z

a 123

4b 567

8c 9

1011

12

可以看到,我們的dataframe矩陣資料表index標籤和columns標籤的值發生了變化,由最初的0、1、2、3變成了a、b、cw、x、y、z我們在資料分析-pandas(1)講解了series陣列,現在來串一下dataframe和series的關係

上圖就是乙個dataframe矩陣資料表,但是,如果單看紅色邊框圈出來的部分,其實就是series陣列

因此,我們說:dataframe是series容器

那麼,問題就來了

既然說dataframeseries的容器,那麼,當初在建立series的時候可以通過傳入字典來建立,那麼,我們建立dataframe的時候可不可也通過傳入字典來建立呢?

答案是:當然可以

#建立字典 a

a =#生成 dataframe 矩陣資料表

t = pd.dataframe(a)

#輸出列印 t

in [9]

: tout[9]

: age name ***

020 小紅 女

118 小亮 男

222 小張 男

可以看到,當我們傳入字典建立dataframe的時候,我們字典的鍵,成為了columns的標籤,事實也證明,我們dataframe是可以通過傳入字典建立的

那麼,當我們學習了上面的知識點後,又有乙個問題接踵而至,對於乙個dataframe型別,既有行索引,又有列索引,我們能夠對他做什麼操作呢

dataframe的基礎屬性方法

作用df.shape

返回矩陣資料表的行數和列數

df.dtypes

返回矩陣資料表的列資料型別

df.ndim

返回資料維度

df.index

返回行索引

df.columns

返回列索引

df.values

物件值,二維ndarry陣列

dataframe的整體情況查詢方法

作用df.head(3)

顯示頭部幾行,預設是5行資料

df.tail(3)

顯示末尾幾行,預設是5行資料

df.info()

df.sort_values(by=「columns標籤」)

dataframe中排序的方法,指按照columns標籤索引進行排序,預設是公升序(ascending=true),通過設定asceding改變排序方式

df.describe()

快速綜合統計結果:計數,均值,標準差,最大值,四分位數,最小值

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

python資料分析 Pandas

import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...

資料分析之Pandas

from pandas import series,dataframe import pandas as pd import numpy as np states california ohio oregon texas year 2000,2001,2002,2003 value 35000,71...