pandas筆記
pip安裝命令
pip install pandas
import pandas as pd
series類
in [2]
:import pandas as pd
in [3]
: obj = pd.series([3
,5,-
2,1]
)
in [4]
: obj
out[4]
:031
52-2
31
dtype: int64
in [5]
: obj.values
out[5]
: array([3
,5,-
2,1]
, dtype=int64)
in [6]
: obj.index
out[6]
: rangeindex(start=
0, stop=
4, step=1)
in [7]
: obj*
2out[7]
:061
102-4
32dtype: int64
in [8]
: obj[obj>2]
out[8]
:031
5dtype: int64
in [9]
: in [9]
: data =
in [10]
: obj = pd.series(data)
in [11]
: obj
out[11]
:
a 30
b 70
c 160
d 5
dtype: int64
in [12]
: index =
['a'
,'b'
,'c'
,'d'
,'g'
]
in [13]
: obj=pd.series(data,index=index)
in [14]
: obj
out[14]
:
a 30.0
b 70.0
c 160.0
d 5.0
g nan
dtype: float64
in [16]
: pd.isnull(obj)
out[16]
:a false
b false
c false
d false
g true
dtype:
bool
in [17]
: pd.notnull(obj)
out[17]
:a true
b true
c true
d true
g false
dtype:
bool
對csv檔案的讀取
data = pd.read_csv(『1.csv』)
data.describe()
data.columns
data.dtypes
data[『name』]#這裡1是key 不是序列
data[[「name」,「age」]]#獲得指定的多個列
head() 函式 預設返回前五行的元素
data[『name』].head()
行的取法有多種,比如指定索引或按條件選取
data[data[age]>16].head(4)#選取年齡大於16的前四個
或者按照多個條件選取資料
data[(data[『age』>16])&(data[『hight』]>160)].head(4)
ix方法通過指定索引來選擇相應的行
data.ix[:3] 這個是操作標籤名,從第乙個開始一直找到標籤3
也可以使用iloc函式
data.iloc[:3] 這個是從操作位置 返回的是dataframe的前3行
ix,iloc的不同點在於,ix操作的索引列標籤的名稱,iloc是操作索引的位置
data.loc[:3] 該函式與python的標準切片方法不同,因為結果包括起始和結束位置的行
data[『weight』]=0 # 這樣所有的weight都會被賦值為0
也可以指定單元格
data.ix[3,1]=0
Pandas學習筆記 Pandas概覽(一)
pandas是python的核心資料分析支援庫,提供了快速 靈活 明確的資料結構,旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的,大小可變的,二維異構 pandas資料結構就像是低維資...
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...
pandas學習筆記
1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...