concat方法相當於資料庫中的全連線(union all),可以指定按某個軸進行連線,也可以指定連線的方式join(outer,inner 只有這兩種)。
與資料庫不同的是concat不會去重,要達到去重的效果可以使用drop_duplicates方法
concat(objs, axis=
0, join=
'outer'
, join_axes=
none
, ignore_index=
false
, keys=
none
, levels=
none
, names=
none
, verify_integrity=
false
, copy=
true
):
from pandas import series,dataframe,concat
df1 = dataframe(
)df2 = dataframe(
)print
'按軸進行內連線\r\n'
,concat(
[df1,df2]
,join=
"inner"
,axis=1)
print
'進行外連線並指定keys(行索引)\r\n'
,concat(
[df1,df2]
,keys=
['a'
,'b'])
#這裡有重複的資料
print
'去重後\r\n'
,concat(
[df1,df2]
,ignore_index=
true
).drop_duplicates(
)
按軸進行內連線
city rank city rank
0 chicago 1 chicago 1
1 san francisco 2 boston 4
2 new york city 3 los angeles 5
進行外連線並指定keys(行索引)
city rank
a 0 chicago 1
1 san francisco 2
2 new york city 3
b 0 chicago 1
1 boston 4
2 los angeles 5
去重後 city rank
0 chicago 1
1 san francisco 2
2 new york city 3
4 boston 4
5 los angeles 5
hive函式中concat與concat ws區別
函式用於將多個字串連線成乙個字串。語法 concat str1,str2,返回值 string 特點 如有任何乙個引數為null 則返回值為 null。舉例 案例1 將test1中的字段拼接成乙個字串 test1中的欄位名abc下的資料也為abc,下同 hive select concat abc,...
js中concat函式使用
concat 方法用於連線兩個或多個陣列。該方法不會改變現有的陣列,而僅僅會返回被連線陣列的乙個副本。arrayobject.concat arrayx,arrayx,arrayx 返回乙個新的陣列。該陣列是通過把所有 arrayx 引數新增到 arrayobject 中生成的。如果要進行 conc...
SQL中concat 字段拼接函式
concat函式,可以將多個字段拼接成乙個字段,如果有乙個值是null,返回的也是null concat ws函式,可以將多個字段拼接成乙個字段,並且指定分隔符 group concat 函式,將指定欄位的值列印在一行,預設 分割。此函式常用與分組之後 這樣的資料並不是我們想要的 在sparksql...