pandas資料結構:系列,資料幀,面板。較高維資料結構是其較低維資料結構的容器
|資料結構 |維數 |描述
|系列|1|1d標記均勻陣列,大小不變
|資料幀 |2 |一般2d標記,大小可變的表結構與潛在的異質型別的列
|面板|3|一般3d標記,大小可變陣列
特性:可變性:所有pandas的資料結構是值可變的(可以更改),除了系列都是大小可變的,系列是大小不變的
系列
系列:具有均勻資料的一維陣列結構
關鍵點:均勻資料,尺寸大小不變,資料的值可變
資料幀
資料幀是乙個具有異構資料的二維陣列。各列資料型別可以不同
關鍵點:異構資料,大小可變,資料可變
面板
面板是具有異構資料的三維資料結構。在圖形表示中很難表示面板,但是乙個面板可以說明為dataframe的容器。
關鍵點:異構資料,大小可變,資料可變
建立series物件
import pandas as pd
s = pd.series([1,3,4,np.nan,6,8])
print(s)
結果:
0 1.0
1 3.0
2 4.0
3 nan
4 6.0
5 8.0
dtype: float64
建立dataframe物件
import pandas as pd
dates=pd.date_range('20190301',periods=7)
df=pd.dataframe(np.random.randn(7,4),index=dates,columns=list('abcd'))
print(df)
通過轉換字典來建立dataframe
df2=pd.dataframe()
結果:
a b c d e f
0 1.0 2019-03-02 1.0 3 test foo
1 1.0 2019-03-02 1.0 3 train foo
2 1.0 2019-03-02 1.0 3 test foo
3 1.0 2019-03-02 1.0 3 train foo
檢視框架的頂部和底部的資料行
dates=pd.date_range('20190301',periods=7)
df=pd.dataframe(np.random.randn(7,4),index=dates,columns=list('abcd'))
print(df.head()) //預設前五行
print(df.tail(3))
df.index //檢視行名
df.columns //檢視列名(表頭)
df.values //檢視列表值
df.describe() //描述統計資訊(以列作為單位,元素數,平均值,標準差,最小值,25%,50%(中位數),75%,最大值)
df.t //檢視轉置
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...
pandas學習筆記
1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...
pandas學習筆記
1.series 類似numpy中的一維陣列,表示為索引 從0開始 和值。建立 import pandas as pd,numpy as np s1 pd.series np.arange 10 s2 pd.series 12 2,5 s3 pd.series 含有的屬性 s1.values s1....