sqoop的安裝和原理

2021-07-22 09:02:25 字數 2401 閱讀 6754

sqoop 是一款資料遷移的工具,可以從 mysql等資料庫遷移到 hdfs 裡面 ,依賴 yarn 和 hdfs,如果伺服器上面有$hadoop_home這個變數,sqoop會自動去讀取這個值來尋找yarn和namenode,安裝在一台節點機上面就可以了
安裝

tar -xvf sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz -c /home/hadoop/ 解壓

cp /tmp/mysql-connector-5.1.8.jar ./sqoop-1.4.4.bin__hadoop-2.0.4-alpha/lib/ 拷貝mysql的連線jar包到lib目錄下面

匯出語句:

.

/sqoop

import--

connect

jdbc:mysql://192

.168.1

.100:3306/test--

username

root--

password

root--

table

student--

target

-dir

/student2-m

2--fields

-terminated-by

'|'-

-columns

"id,

name";

如果這個表沒有主鍵,那麼個-m 只能指定是1

.

/sqoop

import--

connect

jdbc:mysql://192

.168.1

.100:3306/test--

username

root--

password

root--

table

student--

target

-dir

/student2-m

2--fields

-terminated-by

'|'-

-columns

"id,

name"--

where

'id>2

andid

<=5';

–where 是條件

如果是有where –m就會失去作用

.

/sqoop

import--

connect

jdbc:mysql://192

.168.1

.100:3306/test--

username

root--

password

root--

query

'select

*from

student

where

id>3

and$conditions'-m

2--target

-dir

/student5--

split-by

student

.id

如果使用–query這個命令的時候,需要注意的是where後面的引數,and co

ndit

ions

這個引數

必須加上

而且存在

單引號與

雙引號的

區別,如

果設定m

ap數量

為1個時

即−m1

,不用加

上−−s

plit

−by ,否則需要加上

sqoop 匯入到table中 ,注意需要加分隔符

.

/sqoop

export--

connect

jdbc:mysql://192

.168.1

.100/test--

username

root--

password

root--

export

-dir

'/student5'--

table

student1-m

1--fields

-terminated-by

','

./sqoop import --connect jdbc:mysql: --username root --password root --table people --hive-import --hive-overwrite --hive-table people --fields-terminated-by '|' -m 1;將資料從mysql 裝載到hive裡面

Sqoop的安裝方法

sqoop是乙個用來將hadoop和rdbms 如mysql,oracle,postgres等 之間資料相互匯入匯出的工具。安裝與使用都相當簡便。當然在你安裝之前首先得確保你已經安裝了hadoop 這個是必須的 hive hbase。安裝如下 3,配置 sqoop home 4,解壓成功後,將had...

SQOOP的安裝手冊

約定 本次安裝測內容 1,sqoop 從 資料庫中匯入資料到hdfs 2,sqoop 從 資料庫中匯入資料到hive 3,sqoop 從hive中將資料匯出到資料庫 版本 sqoop 1.4.6 sqoop2的版本,效能不太穩定。感謝科多大資料的武老師提供的安裝檔案,感謝 第一步解壓 tar zxv...

Sqoop簡介與原理

apache sqoop 是一種旨在有效地在apache hadoop和諸如關聯式資料庫等結構化資料儲存之間傳輸大量資料的工具。sqoop於2012年3月孵化出來,現在是乙個頂級的apache專案。請注意,1.99.7與1.4.6不相容,且沒有特徵不完整,它並不打算用於生產部署。將匯入或匯出命令翻譯...