ETL的資料同步工具調研 持續更新中

2021-10-06 12:32:08 字數 545 閱讀 6939

扯白了,資料同步工具就是"導資料 "的

名稱社群響應國內使用情況(以前程無憂為參考)

sqoop更新緩慢,對於hbase2.x以上版本使用時需要老版本的jar包

9頁datapipeline

datax沒有官方web ui

2頁talend

1頁informatica商用

9頁datastage商用,2023年以後已經不再維護

9頁oracle goldengate商用,持續維護

2頁kettle開源

18頁kafka實時同步

115頁

nifi

1頁參考:

[1]

ETL工具kettle的插入 更新控制項詳解

在網上查了一下這個控制項的使用,沒有找到乙個詳細的說明,所以自己試了一下,如下圖 img 用來查詢的關鍵字列表裡,表字段a 流裡的字段a,b b的時候,當改變表輸入裡b欄位,執行插入 更新,目標表會新增一條資料,那是因為流裡的a欄位和目標表的a欄位都是相同的,b欄位不同就會認為是新資料,故插入。假如...

資料同步的一些想法 持續更新

之前遇到過很多關於主備庫同步更新資料的問題,一開始是delete或者truncate之後全量插入,但是資料量再大之後,會嚴重影響效率 加重伺服器負擔,甚至導致鎖表,看到有人說用 native的sql把兩步合併成乙個sql,如在mysql中 insert into on duplicate key u...

工具篇(持續更新) pwn中常使用的工具

pwn作為ctf比賽中的重要一部分,用到的工具不及其他部分的多,但是工具相對來說也比較難用。主要用的工具有 pwntools checksec ropgadget one gadget gdb pwndbg ida pro等等。pwntools是乙個用python編寫的ctf框架和開發庫,旨在快速構...