pandas的拼接操作

2021-10-21 23:44:02 字數 2992 閱讀 5582

pandas的拼接分為兩種:

合併:pd.merge

def

make_df

(index,cols)

: df = pd.dataframe(

) df.index = index

return df

df1 = make_df([1

,2,3

,4,5

,6],

list

('abcdef'))

df2 = df1.copy(

)display(df1,df2)

pandas使用pd.concat函式,與np.concatenate函式類似,只是多了一些引數:

objs

axis=0

join='outer'

join_axes=none

ignore_index=false

keys = [value1,value2...]

不匹配指的是級聯的維度的索引不一致。例如縱向級聯時列索引不一致,橫向級聯時行索引不一致

有3種連線方式:

columns=pd.multiindex.from_product([[

'期中'],

['語文'

,'數學'

,'英語']]

)index =

['張三'

,'李四'

,'王五'

]data = np.random.randint(80,

100,size=(3

,3))

ddd = pd.dataframe(data=data,index=index,columns=columns)

columns=pd.multiindex.from_product([[

'期末'],

['語文'

,'數學'

,'英語']]

)index =

['張三'

,'李四'

,'王五'

merge與concat的區別在於,merge需要依據某一共同列來進行合併

使用pd.merge()合併時,會自動根據兩者相同column名稱的那一列,作為key來進行合併。

注意每一列元素的順序不要求一致

pd.merge(df1,df2,left_on='name',right_on='名字')

df1.merge(df2, left_on='name', right_on='名字', how='inner')

當列衝突時,即有多個列名稱相同時,需要使用on=來指定哪乙個列作為key,配合suffixes指定衝突列名

#期中

df1 = dataframe(

)#期末考試

pd.merge(df1, df2, on='name', suffixes=('_期中', '_期末'))

Pandas的拼接操作

import numpy as np from pandas import dataframe,series import pandas as pd 0回顧numpy的級聯 練習 1.生成2個3 3的矩陣,對其分別進行兩個維度上的級聯 nd np.random.randint 0,10,size 3...

pandas基本操作及拼接

二 pandas拼接操作 原教程鏈結,需要自取。pandas是在numpy的基礎上開發的資料處理工具包,提供了快速 靈活的資料結構。它適用於處理一下型別的資料 pandas的主要資料結構 1.用值列表生成series series pd.series 1 3,5 np.nan,6,8 series ...

pandas資料拼接

pandas資料拼接有可能會用到,比如出現重複資料,需要合併兩份資料的交集,並集就是個不錯的選擇,知識追尋者本著技多不壓身的態度蠻學習了一下下 知識追尋者 inheriting the spirit of open source,spreading technology knowledge 在進行學...