針對不同的資料來源之間進行資料同步。
1、關係型資料庫中資料怎麼匯入到hdfs、hbase(壓縮或者非壓縮)?
2、hdfs中的資料(壓縮)怎麼匯入關係型資料庫中?
3、增量資料匯入?
sqoop是乙個hadoop和關係型資料庫之間高效批量資料同步工具。
匯入:
關係型資料庫 -----> hadoop(hdfs\hive\hbase...)
匯出:hadoop(hdfs) ----> 關係型資料庫
優點:跨平台資料同步
缺點:不是很靈活。
4.1 前提
1 hadoop的安裝參考位址
2 需要jdk
3 需要準備關係型資料庫的依賴jar包
4.2 安裝
1.解壓配置環境變數
[root@hadoop01 local]
# tar -zxvf /home/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -c /usr/lo
企業實戰 企業FTP搭建
提前關閉selinux 和firewalld防火牆 1.安裝vsftp軟體包 yum y install vsftpd 2.啟動vsftpd伺服器 systemctl restart vsftpd systemctl enable vsftpd 3.檢查服務是否正常啟動 ps ef grep vsf...
Linux Redis實戰教程
1 linux 1.1 linux介紹 包括linux和windows的區別,linux歷史及使用場景,linux版本介紹 1.2 linux安裝 包括虛擬機器軟體介紹及安裝,linux安裝配置,linux目錄介紹,crt遠端連線linux 1.3 常用命令 命令分類如下 磁碟管理命令,檔案瀏覽命令...
Mahout實戰教程
課程大綱 第一周mahout概述 mahout安裝 mahout安裝測試 mahout演算法庫介紹 解析聚類演算法 解析分類演算法 協同過濾演算法 第二週聚類演算法詳解 一 canopy演算法簡介 1 mahout中canopy演算法實現原理 2 mahout的canopy演算法實戰 3 hadoo...