不同hive集群中基於表的資料一致性比對

2021-08-25 14:12:09 字數 445 閱讀 2775

因對hadoop集群進行資料遷移,資料遷移完畢後進行兩個hive庫的資料一致性的比對,不僅對源表資料進行比對,而且要同時使用兩個集群加工相同資料,對加工後的資料進行資料一致性比對,下面採用md5方法的驗證:

#!/bin/bash

db='hmdbi'

hive -e

"use $db;show tables '*';"> tables.txt

sleep 2

cat tables.txt |while

read eachline

dohive -e

"use $db;select * from $eachline;" >>$eachline.txt

md5sum $eachline.txt >> md5sum.txt

done

集群間hive資料表的遷移

方式一 此方法需要建庫建表 在原集群hive上檢視遷移表的建表語句及所在庫,然後在新集群hive上建庫建表 show create table tb name create database db name create table tb name hadoop fs get user hive w...

hive表集群間的遷移

記錄下工作中由於需要複製生產環境到測試環境以供測試使用做的一次資料庫的遷移,方法比較繁瑣,有待改進 基本思路 將生產環境的表匯出到hdfs,將hdfs的資料get到本地,scp到測試環境的本地,put到測試環境的hdfs,再進行匯入 hive表到處到hdfs export table table n...

Hive刪除表中資料

發現hive表刪除資料不能使 用 color 不能使用 delete from table name 中sql語句 1.刪除符合條件的資料 其中 是你需要保留的資料的查詢條件。insert overwrite table t table1 select from t table1 where x i...