dataframe和series的關係
傳入字典建立dataframe
dataframe的方法
在資料分析-pandas(2)的時候,我們簡單的講解了一下關於dataframe
的橫向索引index
和縱向索引columns
,他們預設是從0
開始的,現在我們來學習一下,如何建立特定的index
和columns
#匯入pandas包
in [2]
:import pandas as pd
#匯入numpy包
in [3]
:import numpy as np
#生成dataframe矩陣資料表
in [4]
: t = pd.dataframe(np.arange(1,
13).reshape(3,
4))#得到結果
in [5]
: tout[5]
:012
3012
3415
6782
9101112
#建立特定的index和columns的dataframe
in [6]
: t = pd.dataframe(np.arange(1,
13).reshape(3,
4),index=
["a"
,"b"
,"c"
],columns=
["w"
,"x"
,"y"
,"z"])
#輸出列印 t
in [7]
: tout[7]
: w x y z
a 123
4b 567
8c 9
1011
12
可以看到,我們的dataframe
矩陣資料表index
標籤和columns
標籤的值發生了變化,由最初的0、1、2、3
變成了a、b、c
和w、x、y、z
我們在資料分析-pandas(1)講解了series陣列,現在來串一下dataframe和series的關係
上圖就是乙個dataframe
矩陣資料表,但是,如果單看紅色邊框圈出來的部分,其實就是series
陣列
因此,我們說:dataframe是series容器
那麼,問題就來了
既然說dataframe
是series
的容器,那麼,當初在建立series
的時候可以通過傳入字典來建立,那麼,我們建立dataframe的時候可不可也通過傳入字典來建立呢?
答案是:當然可以
#建立字典 a
a =#生成 dataframe 矩陣資料表
t = pd.dataframe(a)
#輸出列印 t
in [9]
: tout[9]
: age name ***
020 小紅 女
118 小亮 男
222 小張 男
可以看到,當我們傳入字典建立dataframe
的時候,我們字典的鍵,成為了columns
的標籤,事實也證明,我們dataframe
是可以通過傳入字典建立的
那麼,當我們學習了上面的知識點後,又有乙個問題接踵而至,對於乙個dataframe型別,既有行索引,又有列索引,我們能夠對他做什麼操作呢
dataframe的基礎屬性方法
作用df.shape
返回矩陣資料表的行數和列數
df.dtypes
返回矩陣資料表的列資料型別
df.ndim
返回資料維度
df.index
返回行索引
df.columns
返回列索引
df.values
物件值,二維ndarry陣列
dataframe的整體情況查詢方法
作用df.head(3)
顯示頭部幾行,預設是5行資料
df.tail(3)
顯示末尾幾行,預設是5行資料
df.info()
df.sort_values(by=「columns標籤」)
dataframe中排序的方法,指按照columns標籤索引進行排序,預設是公升序(ascending=true),通過設定asceding改變排序方式
df.describe()
快速綜合統計結果:計數,均值,標準差,最大值,四分位數,最小值
資料分析 pandas
pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...
python資料分析 Pandas
import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...
資料分析之Pandas
from pandas import series,dataframe import pandas as pd import numpy as np states california ohio oregon texas year 2000,2001,2002,2003 value 35000,71...