pandas的拼接分為兩種:
合併:pd.merge
def
make_df
(index,cols)
: df = pd.dataframe(
) df.index = index
return df
df1 = make_df([1
,2,3
,4,5
,6],
list
('abcdef'))
df2 = df1.copy(
)display(df1,df2)
pandas使用pd.concat函式,與np.concatenate函式類似,只是多了一些引數:
objs
axis=0
join='outer'
join_axes=none
ignore_index=false
keys = [value1,value2...]
不匹配指的是級聯的維度的索引不一致。例如縱向級聯時列索引不一致,橫向級聯時行索引不一致
有3種連線方式:
columns=pd.multiindex.from_product([[
'期中'],
['語文'
,'數學'
,'英語']]
)index =
['張三'
,'李四'
,'王五'
]data = np.random.randint(80,
100,size=(3
,3))
ddd = pd.dataframe(data=data,index=index,columns=columns)
columns=pd.multiindex.from_product([[
'期末'],
['語文'
,'數學'
,'英語']]
)index =
['張三'
,'李四'
,'王五'
merge與concat的區別在於,merge需要依據某一共同列來進行合併
使用pd.merge()合併時,會自動根據兩者相同column名稱的那一列,作為key來進行合併。
注意每一列元素的順序不要求一致
pd.merge(df1,df2,left_on='name',right_on='名字')
df1.merge(df2, left_on='name', right_on='名字', how='inner')
當列衝突時,即有多個列名稱相同時,需要使用on=來指定哪乙個列作為key,配合suffixes指定衝突列名
#期中
df1 = dataframe(
)#期末考試
pd.merge(df1, df2, on='name', suffixes=('_期中', '_期末'))
Pandas的拼接操作
import numpy as np from pandas import dataframe,series import pandas as pd 0回顧numpy的級聯 練習 1.生成2個3 3的矩陣,對其分別進行兩個維度上的級聯 nd np.random.randint 0,10,size 3...
pandas基本操作及拼接
二 pandas拼接操作 原教程鏈結,需要自取。pandas是在numpy的基礎上開發的資料處理工具包,提供了快速 靈活的資料結構。它適用於處理一下型別的資料 pandas的主要資料結構 1.用值列表生成series series pd.series 1 3,5 np.nan,6,8 series ...
pandas資料拼接
pandas資料拼接有可能會用到,比如出現重複資料,需要合併兩份資料的交集,並集就是個不錯的選擇,知識追尋者本著技多不壓身的態度蠻學習了一下下 知識追尋者 inheriting the spirit of open source,spreading technology knowledge 在進行學...