Atlas元資料 整合sqoop

2021-10-09 02:25:17 字數 1330 閱讀 5924

atlas整合sqoop文件較少 簡單寫一下,sqoop hook 與hive hook是相輔相成的

environment:cdh:6.2.0

sqoop:1.4.7

atlas:2.0.0

hive:2.1.1

我用的cdh版本:

1.確保/atlas/apache-atlas-2.0.0/hook/sqoop檔案,沒有看我部署篇

atlas-plugin-classloader-2.0.0.jar

atlas-sqoop-plugin-impl

sqoop-bridge-shim-2.0.0.jar

...

...######### hive hook configs #######

atlas.hook.hive.synchronous=false

atlas.hook.hive.numretries=3

atlas.hook.hive.queuesize=10000

atlas.cluster.name=primary

######### sqoop hook configs #######

atlas.hook.sqoop.synchronous=false

atlas.hook.sqoop.numretries=3

atlas.hook.sqoop.queuesize=10000

######### atlas authorization #########

atlas.authorizer.impl=******

atlas.authorizer.******.authz.policy.file=atlas-******-authz-policy.json

......

# hive hook jar進行重新打包

scp hook/sqoop/*.jar /opt/cloudera/parcels/cdh/lib/sqoop/lib

scp hook/sqoop/atlas-sqoop-plugin-impl/*.jar /opt/cloudera/parcels/cdh/lib/sqoop/lib

# hive jar 進行更新

使用Atlas進行元資料管理之Atlas簡介

背景 筆者和團隊的小夥伴近期在進行資料治理 元資料管理方向的探索,在接下來的系列文章中,會陸續與讀者們進行分享在此過程中踩過的坑和收穫。0 使用atlas進行元資料管理之atlas簡介 1 使用atlas進行元資料管理之glossary 術語 2 使用atlas進行元資料管理之type 型別 談到資...

資料整合 Flume和Sqoop

flume和sqoop是hadoop資料整合和收集系統,兩者的定位不一樣,下面根據個人的經驗與理解和大家做乙個介紹 flume由cloudera開發出來,有兩大產品 flume og和flume ng,flume og的架構過於複雜,在尋問當中會有資料丟失,所以放棄了。現在我們使用的是flume n...

HBase與Sqoop的整合

之前學習sqoop的時候都是hadoop,hive和rdbms之間進行資料的匯入與匯出,並沒有與hbase整合,下面就來講解hbase與sqoop的整合 需求 利用 sqoop 在 hbase 和 rdbms 中進行資料的轉儲,將 rdbms mysql 中的資料抽取到 hbase 中 1.在sqo...