pandas dataframe進行向量化運算時,是根據行和列的索引值進行計算的,而不是行和列的位置:
1. 行和列索引一致:
importpandas as pd
df1 = pd.dataframe()
df2 = pd.dataframe()
print df1 +df2
a b c0 11 44 77
1 22 55 88
2 33 66 99
2. 行索引一致,列索引不一致:
df1 = pd.dataframe()df2 = pd.dataframe()
print df1 + df2
a b c d0 nan 74 47nan
1 nan 85 58nan
2 nan 96 69 nan
沒有對應索引的值,會用空來代替進行計算
3. 行索引不一致,列索引一致:
df1 = pd.dataframe(,index=['
row1
', '
row2
', '
row3'])
df2 = pd.dataframe(,
index=['
row4
', '
row3
', '
row2'])
print df1 + df2
a b crow1 nan nan nan
row2 32.0 65.0 98.0row3 23.0 56.0 89.0row4 nan nan nan
其實總結下來就是,行列索引相同的,進行計算,沒有的全部用空進行計算
Pandas DataFrame用法總結
1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...
Pandas DataFrame常用方法
1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...
Pandas DataFrame 按行構建
當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...