pandas 小學筆記

pandas筆記

pip安裝命令

pip install pandas

import pandas as pd

series類

in [2]
:import pandas as pd         
in [3]
: obj = pd.series([3
,5,-
2,1]
)                                     
in [4]
: obj                         
out[4]
:031
52-2
31                              
dtype: int64           
in [5]
: obj.values
out[5]
: array([3
,5,-
2,1]
, dtype=int64)
in [6]
: obj.index
out[6]
: rangeindex(start=
0, stop=
4, step=1)
in [7]
: obj*
2out[7]
:061
102-4
32dtype: int64
in [8]
: obj[obj>2]
out[8]
:031
5dtype: int64
in [9]
: in [9]
: data =
in [10]
: obj = pd.series(data)                   
in [11]
: obj                                     
out[11]
:                                         
a     30                                         
b     70                                         
c    160                                         
d      5                                         
dtype: int64                                     
in [12]
: index =
['a'
,'b'
,'c'
,'d'
,'g'
]           
in [13]
: obj=pd.series(data,index=index)         
in [14]
: obj                                     
out[14]
:                                         
a     30.0                                       
b     70.0                                       
c    160.0                                       
d      5.0                                       
g      nan                                       
dtype: float64  
in [16]
: pd.isnull(obj)
out[16]
:a    false
b    false
c    false
d    false
g     true
dtype:
bool    
in [17]
: pd.notnull(obj)
out[17]
:a     true
b     true
c     true
d     true
g    false
dtype:
bool

對csv檔案的讀取

data = pd.read_csv(『1.csv』)

data.describe()

data.columns

data.dtypes

data[『name』]#這裡1是key 不是序列

data[[「name」,「age」]]#獲得指定的多個列

head() 函式預設返回前五行的元素

data[『name』].head()

行的取法有多種，比如指定索引或按條件選取

data[data[age]>16].head(4)#選取年齡大於16的前四個

或者按照多個條件選取資料

data[(data[『age』>16])&(data[『hight』]>160)].head(4)

ix方法通過指定索引來選擇相應的行

data.ix[:3] 這個是操作標籤名，從第乙個開始一直找到標籤3

也可以使用iloc函式

data.iloc[:3] 這個是從操作位置返回的是dataframe的前3行

ix,iloc的不同點在於，ix操作的索引列標籤的名稱，iloc是操作索引的位置

data.loc[:3] 該函式與python的標準切片方法不同，因為結果包括起始和結束位置的行

data[『weight』]=0 # 這樣所有的weight都會被賦值為0

也可以指定單元格

data.ix[3,1]=0

Pandas學習筆記 Pandas概覽（一）

pandas是python的核心資料分析支援庫，提供了快速靈活明確的資料結構，旨在簡單直觀的處理關係型資料型的資料。pandas適用於處理以下型別的資料維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的，大小可變的，二維異構 pandas資料結構就像是低維資...

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...

pandas學習筆記

1 建立物件，瀏覽資料建立物件，瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...

pandas 小學筆記

Pandas學習筆記 Pandas概覽（一）

pandas學習筆記

pandas學習筆記

相關推薦