centos 7
hive 1.2.1
apache-tez-0.9.1
上傳taz到hdfs中
hadoop fs -mkdir /tez
hadoop fs -put apache-tez-0.9.1-bin.tar.gz /tez
解壓縮
tar -zxvf apache-tez-0.9.1-bin.tar.gz -c /opt
修改名稱
mv /opt/apache-tez-0.9.1-bin /opt/tez-0.9.1
在hive/conf目錄下建立tez-site.xml
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
>
>
>
tez.lib.urisname
>
>
$/tez/apache-tez-0.9.1-bin.tar.gzvalue
>
property
>
>
>
tez.use.cluster.hadoop-libsname
>
>
truevalue
>
property
>
>
>
tez.history.logging.service.classname
>
>
org.apache.tez.dag.history.logging.ats.atshistoryloggingservicevalue
>
property
>
configuration
>
在hive/conf/hive-env.s**件中新增tez環境變數配置和依賴包環境變數配置 新增如下配置
# set hadoop_home to point to a specific hadoop install directory
export hadoop_home=/opt/hadoop-2.7.2
# hive configuration directory can be controlled by:
export hive_conf_dir=/opt/hive-1.2.1/conf
# folder containing extra libraries required for hive compilation/execution can be controlled by:
export tez_home=/opt/tez-0.9.1 #是你的tez的解壓目錄
export tez_jars=
""for jar in
`ls $tez_home |
grep jar`;do
export tez_jars=
$tez_jars
:$tez_home/$jar
done
for jar in
`ls $tez_home/lib`;do
export tez_jars=
$tez_jars
:$tez_home/lib/$jar
done
export hive_aux_jars_path=/opt/hadoop-2.7.2/share/hadoop/common/hadoop-lzo-0.4.20.jar$tez_jars
修改hive計算引擎 編輯hive/conf/hive-site.xml 新增如下配置
>
>
hive.execution.enginename
>
>
tezvalue
>
property
>
Hive更換Tez計算引擎
centos7 jdk1.8 hive 2.3.6 hadoop 2.7.7 tez 0.9.2 linux下hive的安裝 用hive直接編寫mr程式,假設有4個有依賴關係的mr作業,上圖中,藍色代表maptask,綠色代表reducetask,雲狀表示中間結果持久化到磁碟 tez可以將多個有依賴...
設定hive執行引擎為Tez
我們知道hive預設計算引擎為mr,而mr的特性決定了它的運算速度並不是太讓人滿意。在此將其運算引擎修改為tez 當然在此需要先安裝tez tez基於記憶體的計算使得hive可以有更高的運算效率。安裝配置如下 在此假設已經安裝好基礎hadoop hive集群。2 解壓縮apache tez 0.9....
關於TEZ引擎的部分缺陷
很久沒更新部落格了,今天發現以前的小點還是等幫助到一些朋友的,今天也更新一下,打個卡。今天說一下tez引擎使用時容易犯錯的點吧。首先要知道tez是什麼,下圖為官網上對tez的簡略圖。官網首頁也介紹了tez的2個主要設計主題是 1.通過以下方式增強終端使用者的能力 富有表現力的資料流定義api 靈活的...