大資料學習之十五 sqoop的安裝和使用

2022-08-19 19:48:11 字數 1699 閱讀 4171

1.概念了解

sqoop主要用於hadoop與傳統的資料庫(mysql、postgresql...)間進行資料的傳遞,可以將乙個關係型資料庫(例如:mysql,oracle,postgrep等)中的資料導到hadoop的hdfs中,也可以將hdfs的資料導進到關係型資料庫中。

2.sqoop的安裝

(1)將壓縮包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.jar放在linux的路徑下,並修改配置檔案/etc/profile

export sqoop_home=該壓縮包所在路徑

export path=$path:$sqoop_home/bin

(2)更新環境變數的值

source /etc/profile

檢驗是否安裝成功:輸入sqoop ,顯示提示說明安裝成功。

安裝後驗證:

sqoop list-databases --connect jdbc:mysql://本地ip:3306/ --username root --password root123

若顯示資料庫,說明安裝完成。

3.sqoop的使用

sqoop支援很多對資料庫的操作,比如檢視資料庫,檢視資料表,對資料的匯入匯出,匯入所有的表。當然用的最多的還是export和import兩個指令對資料庫和hadoop資料進行匯出匯入。

(1)利用sqoop資料從mysql中匯入到hdfs

現在資料庫中建立乙個employee的表,欄位有id,name,age,place,entry_time,position

,然後再填充一些資料。

執行命令格式:sqoop import --connect jdbc:mysql://本地ip:3306/資料庫name   --username root --password 123456 --table 表名--target-dir  hdfs中的路徑  -m 1

需要注意的是:要匯入到hdfs中的目錄不能提前存在。

(2)將資料從hdfs匯出到mysql中

將hdfs中的資料/input/f.txt匯入到資料庫中:

執行命令格式:

#sqoop export --connect jdbc:mysql: --username root --password  linux  --table table03 --export-dir '/input/f.txt' --fields-terminated-by ','

其中資料庫db01,table03都是提前存在的,並且table03的屬性是對應hdfs中的資料的。

大資料Sqoop系列之Sqoop匯入匯出資料

鏈結mysql資料庫url connect jdbc mysql 鏈結mysql資料庫使用者名稱 username root 鏈結mysql資料庫密碼 password 123456 鏈結mysql資料庫中的表 table tb1 設定map的個數 設定匯入到hdfs檔案所在的位置 target d...

大資料學習 sqoop匯出資料

把資料從hadoop匯出到關係型資料庫 將資料從hdfs匯出到rdbms資料庫 匯出前,目標表必須存在於目標資料庫中。u 預設操作是從將檔案中的資料使用insert語句插入到表中 u 更新模式下,是生成update語句更新表資料 以下是export命令語法。sqoop export generic ...

大資料學習 之MapReduce Job

1 先把yarn服務停了 hadoop hadoop001 hadoop 2.6.0 cdh5.7.0 sbin stop yarn.sh 2 把之前的資訊刪了 hadoop hadoop001 hadoop 2.6.0 cdh5.7.0 hdfs dfs rm r f user 3 再建立hdfs...