# 方式一
# pd.series帶標籤的陣列,index傳遞索引
t1=pd.series([1
,2,3
,4,2
,2],index=
list
('abcdef'))
(t1)
('*'
*100
)# 方式二
tem_dict=
t2=pd.series(tem_dict)
(t2)
# 變換資料型別
(t2.astype(
'float'))
# 取值,方法一索引來取
(t2[
'age'])
# 取值,方法二位置來取
(t2[1]
)# 取連續多行
(t2[:2
('*'
*100
)# 取不連續行
(t2[[1
,2]]
(t2[
['age'
,'name']]
('*'
*100
)# 布林索引
(t1[t1>2]
('*'
*100
)# 取索引
(t1.index)
('*'
*100
)# list強制型別轉行
(list
(t1.index)
)# 取前兩個
(list
(t1.index)[:
2])# 可遍歷
for i in t1.index:
(i)print
('*'
*100
)#獲取長度
(len
(t1.index)
)# values
(t1.values)
import pandas as pd
import numpy as np
print
(pd.dataframe(np.arange(12)
.reshape(3,
4)))
# index指定行索引,columns指定列索引
print
(pd.dataframe(np.arange(12)
.reshape(3,
4),index=
list
('abc'
),columns=
list
('wxyz'))
)d1=
t2=pd.dataframe(d1)
print
(t2)
# 行索引
print
(t2.index)
# 列索引
print
(t2.columns)
# 取值
print
(t2.values)
# 形狀
print
(t2.shape)
# 列資料型別
print
(t2.dtypes)
# 資料緯度
print
(t2.ndim)
import pandas as pd
import numpy as np
t3=pd.dataframe(np.arange(12)
.reshape(3,
4),index=
list
('abc'
),columns=
list
('wxyz'))
print
(t3)
print
(t3.loc[
'a',
'z']
)# 取整行
# 方法一
print
(t3.loc[
'a']
)# 方法2
print
(t3.loc[
'a',:]
)# 取整列
print
(t3.loc[:,
'y']
)# 取多行
print
(t3.loc[
['a'
,'c'],
:])# 取多列
print
(t3.loc[:,
['y'
,'z']]
)# 按位置取某一行
print
(t3.iloc[1]
)print
(t3.iloc[1,
:])# 按位置取某一列
print
(t3.iloc[:,
1])# 按位置取多列
print
(t3.iloc[:,
[1,2
]])# 按位置取多行多列
print
(t3.iloc[1:
,:1]
)
import pandas as pd
import numpy as np
t3=pd.dataframe(np.arange(12)
.reshape(3,
4),index=
list
('abc'
),columns=
list
('wxyz'))
# 判斷是否為nan
print
(pd.notnull(t3)
)t3.iloc[[1
,2],
[1,2
]]=np.nan
print
(t3)
print
('*'
*100
)# 篩選x那一列沒有nan的行,列上的篩選是行的座標
print
(t3[pd.notnull(t3[
'x'])]
)print
('*'
*100
)# 刪除nan的行,how預設為any,有nan就刪除,可以改為all全部為nan時才刪除
print
(t3.dropna(axis=
0,how=
'any'))
# 填充nan
print
(t3.fillna(0)
)# 填充nan,填充為均值
print
(t3.fillna(t3.mean())
)print
('*'
*100
)# 填充x列的nan,填充為x列的均值
print
(t3[
'x']
.fillna(t3[
'x']
.mean())
)
python重新命名列名 Pandas對列進行重新命名
在處理dataframe資料的時候,經常需要對列進行重新命名,我們現在看一下到底如何進行重新命名操作。首先生成乙個dataframe。import pandas as pd province pd.dataframe province idcode省份 01a廣東 12b廣西 23c福建 34d福建...
python 安裝pandas教程
python3 安裝pandas 如果使用python2需要安裝的話,可以用pip install pandas 如果使用python3需要安裝的話,可以用pip3 install pandas 會自動安裝依賴庫 呼叫包,看下是否安裝成功 python3 python 3.8 1 tags v3.8...
python資料科學 Pandas
學習筆記 pandas物件 資料的取值與選擇 pandas數值運算方法 缺失值的處理 層級索引 合併與連線資料集 累積與分組 pandas物件 pandas有三個基本資料結構 series dataframe和index 資料的取值與選擇 pandas數值運算方法 pandas是建立在numpy基礎...