pandas合併操作

2021-09-25 03:36:35 字數 1017 閱讀 6992

通過鍵(這裡的鍵是dataframe的某一列)拼接列,應用場景:針對同一主鍵存在兩張包含不同欄位的表,如果想把這兩張表整合成一張表,就可以使用merge。merge結果的行數並沒有

pd.merge(left, right, how="inner", on=none, suffixes=("_x", "_y"))

引數how:

- inner: 按照拼接鍵匹配,取交集

- outer: 按照拼接鍵匹配,取並集

- left: 拼接鍵與左df完全一樣,從右df中尋找與左df相匹配的行

- right: 拼接鍵與右df完全一樣,從左df中尋找與右df相匹配的行

- cross: 交叉連線,返回笛卡爾積

注:無論採用哪種方式,merge函式第乙個引數的列始終在最前面

是pd的方法,即pd.merge, 每次只能合併兩個df

同樣是拼接列,但是預設將索引作為鍵。引數on用來指定左df的列名,若指定後,用該列名與右df的索引進行拼接。

df1.join([df2,...], on=none, how='left', lsuffix=「」, rsuffix=「」, sort=false)
屬於df的方法,lsuffix和rsuffix用於當df1和df2存在同名的列時,用於區分。

pd.concat(objs, axis=0, join='outer', join_axes=none, ignore_index=false,

keys=none, levels=none, names=none, verify_integrity=false,

copy=true)

join引數表示多個df按索引拼接的方式

屬於pd的方法,可以用來合併多個df, 將ignore_index設為true進行索引重排。

屬於df的方法,有點類似pd.concat([df1, df2], axis=0)

用的較少,相當於pd.concat的簡版,只能在行方向進行拼接

pandas 合併操作join函式

dataframe內建的join方法是一種快速合併的方法。它預設以index作為對齊的列。join中的how引數和merge中的how引數一樣,用來指定表合併保留資料的規則。具體可見前面的 how 說明。在實際應用中如果右表的索引值正是左表的某一列的值,這時可以通過將 右表的索引 和 左表的列 對齊...

pandas 做合併操作 merge函式

pandas的merge方法提供了一種類似於sql的記憶體鏈結操作,官網文件提到它的效能會比其他開源語言的資料操作 例如r 要高效。merge的引數 on 列名,join用來對齊的那一列的名字,用到這個引數的時候一定要保證左表和右表用來對齊的那一列都有相同的列名。left on 左表對齊的列,可以是...

pandas資料合併

pandas 提供了三種主要方法可以對資料進行合併 pandas.merge 方法 資料庫風格的合併 例如,通過merge 方法將兩個dataframe合併 on name 的意思是將name列當作鍵 預設情況下,merge做的是內連線 inner 即鍵的交集。其他方式還有左連線 left 右連線 ...