自定義索引:data = pd.series([0.25, 0.5, 0.75, 1.0])
print(data.index) #返回索引
print(data.values) #返回資料
data = pd.series([0.25, 0.5, 0.75, 1.0],index=['a', 'b', 'c', 'd'])
pd.series(
[2, 4, 6]
)
pd.series(5, index=
[100, 200, 300]
)#自動填充,指定索引值
dataframe是乙個**型的資料結構,既有行索引,也有列索引,可以看作由series物件組成的字典pd.series(
) pd.series(
, index=
[3, 2]
)#指定索引篩選需要的結果
b = pd.dataframe(
, columns=
['name', 'age'])
print(b.values)
#返回二維形式的陣列,如果資料型別不一樣,那麼會自動向上轉換成可以相容所有資料的型別
print(b.columns)
print(b.index)
## 2.建立
## 01.由含有等長列表的字典來建立
```bash
b = pd.dataframe(, columns=[
'name', 'age'], index=['one', 'two', 'three'])
print(b)#columns指定列的順序,index指定行索引名稱
population=pd.series(
['1000','3000','2000'])
area=pd.series(
['a','b','c'])
pd.dataframe(
)
pd.dataframe(np.random.rand(3, 2),columns=
['foo', 'bar'
],index=
['a', 'b', 'c'
])
a = np.zeros(3, dtype=[(
'a', 'i8'
), (
'b', 'f8')]
)print(pd.dataframe(a))
獲取列:data =
, 'age':}
m = pd.dataframe(dataindex=
['one','two','three'])
#可以指定索引,如果不指定則會自己合併排序
print(m)
獲取行:b[
'name'
]b.name
利用索引修改值:b.ix[
'one'
]
新增新列並賦值:c=pd.series(
['女'
],index=
['one'])
#指定修改值的列及內容
b['***'
]=c
構建陣列或者dataframe物件時,所用到的標籤都會轉換成乙個index物件,它不可修改。b[
'height']=
['170','160','180'
]print(b)
method可選引數為
ffill :向前填充
bfill :向後填充
a.reindex(index,columns) #a不會發生變化,生成了乙個新的物件
a.ix(index,columns) #index和columns都必須是原有的索引
a.drop(
[index]
)#丟棄指定行
a.drop(
,axis=1)
#丟棄指定列
示例:
import pandas as pd
b = pd.dataframe(
, columns=
['name', 'age', '***'
], index=
[5, 4, 3]
)print(b.ix[5:4]
)#行索引5到4
print(b.ix[:2, :1]
)#前兩行,第一列那
print(b.ix[:, 'name'])
#name列所有行
print(b.ix[5]
)#索引為5的行
print(b.xs(
['name'
], axis=1))
#預設axis=0,選取name列
兩個pandas物件進行這些運算時,行和列取並集,所以會有預設值nan來填充交集以外的部分,若想用其他值來填充,則可以通過引數fill_value設定,如方法a.add(b,fill_value)
#對某個軸應用函式
#對a所有元素應用某格式
a[column_name].map(fmt)
#對a的某一列應用某格式
a.sort_index(axis,ascending,by)
#by代表按照某一列或者幾列進行排序,返回的是乙個已排序的物件
a.order(
)#按值排序
a.index.is_unique(
)#判斷索引是否唯一
a.sum(axis,skipna=false)
#skipna是指是否要跳過預設值
a.describe(
)#得到多個匯**計
)#將a中的唯一值篩選出來
a.value_counts(sorted=true)
#計算a中各值出現的次數
mark=a.isin(list)
a[mark]
#篩選a中在list中的值
Pandas學習筆記一 如何建立Series物件
常見的建立pandas物件的方式,都像這樣的形式 pd.series data,index index 其中,index是乙個可選引數,data引數支援多種資料型別 例如,data可以時列表或numpy陣列,這是index預設值為整數序列 pd.series 2,4,6 out 58 02 1426...
Pandas學習筆記 Pandas概覽(一)
pandas是python的核心資料分析支援庫,提供了快速 靈活 明確的資料結構,旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的,大小可變的,二維異構 pandas資料結構就像是低維資...
Pandas的基本操作(一)
世界會向那些有目標和遠見的人讓路。pandas是基於numpy的一種處理資料的工具,一般用於資料預處理與資料分析 import pandas as pd 函式 read csv 用法 pd.read csv 檔名 該函式返回dataframe型別的資料結構,與numpy中的ndarray相似 該資料...