大資料 八 Sqoop

2021-07-09 12:17:49 字數 868 閱讀 7367

sqoop是什麼

sqoop:sql-to-hadoop

連線 傳統關係型資料庫 和 hadoop 的橋梁

把關係型資料庫的資料匯入到 hadoop 系統 ( 如 hdfs hbase 和 hive) 中;

把資料從 hadoop 系統裡抽取並匯出到關係型資料庫裡。

利用mapreduce加快資料傳輸速度 :

將資料同步問題轉化為mr作業

批處理方式進行資料傳輸:實時性不夠好

sqoop優勢

高效、可控地利用資源

任務並行度,超時時間等

資料型別對映與轉換

可自動進行,使用者也可自定義

支援多種資料庫

mysql

oracle

postgresql

sqoop import

將資料從關係型資料庫匯入hadoop中

步驟1:sqoop與資料庫server通訊,獲取資料庫表的元資料資訊; 

步驟2:sqoop啟動乙個map-only的mr作業,利用元資料資訊並行將資料寫入hadoop。

特點:可以指定hdfs路徑,指定關聯式資料庫的表,字段,連線數(不壓垮資料庫),可以匯入多個表,支援增量匯入(手動指定起始id、事件,或自動記錄上次結束位置,自動完成增量匯入)

sqoop export

將資料從hadoop匯入關係型資料庫導中

步驟1:sqoop與資料庫server通訊,獲取資料庫表的元資料資訊;

步驟2:並行匯入資料:

將hadoop上檔案劃分成若干個split;

每個split由乙個map task進行資料匯入。

sqoop與其他系統結合

sqoop可以與oozie、hive、hbase等系統結合;

大資料 Sqoop簡介

sqoop 發音 skup 是sql to hadoop的縮寫,是一款開源的工具,主要用來在hadoop和關係資料之間交換資料,可以改進資料的資料的互操作性。通過sqoop,可以方便地將資料從mysql oracle postgresql等關聯式資料庫中匯入hadoop 比如匯入到hdfs hbas...

大資料Sqoop系列之Sqoop匯入匯出資料

鏈結mysql資料庫url connect jdbc mysql 鏈結mysql資料庫使用者名稱 username root 鏈結mysql資料庫密碼 password 123456 鏈結mysql資料庫中的表 table tb1 設定map的個數 設定匯入到hdfs檔案所在的位置 target d...

大資料學習 sqoop匯出資料

把資料從hadoop匯出到關係型資料庫 將資料從hdfs匯出到rdbms資料庫 匯出前,目標表必須存在於目標資料庫中。u 預設操作是從將檔案中的資料使用insert語句插入到表中 u 更新模式下,是生成update語句更新表資料 以下是export命令語法。sqoop export generic ...