pandas DataFrame 4 向量化運算

2021-09-07 19:20:20 字數 994 閱讀 3711

pandas dataframe進行向量化運算時,是根據行和列的索引值進行計算的,而不是行和列的位置:

1. 行和列索引一致:

import

pandas as pd

df1 = pd.dataframe()

df2 = pd.dataframe()

print df1 +df2

a   b   c

0 11 44 77

1 22 55 88

2 33 66 99

2. 行索引一致,列索引不一致:

df1 = pd.dataframe()

df2 = pd.dataframe()

print df1 + df2

a   b   c   d

0 nan 74 47nan

1 nan 85 58nan

2 nan 96 69 nan

沒有對應索引的值,會用空來代替進行計算

3. 行索引不一致,列索引一致:

df1 = pd.dataframe(,

index=['

row1

', '

row2

', '

row3'])

df2 = pd.dataframe(,

index=['

row4

', '

row3

', '

row2'])

print df1 + df2

a     b     c

row1 nan nan nan

row2 32.0 65.0 98.0row3 23.0 56.0 89.0row4 nan nan nan

其實總結下來就是,行列索引相同的,進行計算,沒有的全部用空進行計算

Pandas DataFrame用法總結

1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...

Pandas DataFrame常用方法

1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...

Pandas DataFrame 按行構建

當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...