hive引數配置方式
語法結構
hive [-hiveconf x=y]* [
<-i filename>
]* [
<-f filename>
|<-e query-string>
][-s]
hive引數大全:
開發hive應用時,不可避免地需要設定hive的引數。設定hive的引數可以調優hql**的執行效率,或幫助定位問題。然而實踐中經常遇到的乙個問題是,為什麼設定的引數沒有起作用?這通常是錯誤的設定方式導致的。
配置檔案:hive的配置檔案包括
使用者自定義配置檔案:$hive_conf_dir/hive-site.xml
預設配置檔案:$hive_conf_dir/hive-default.xml
使用者自定義配置會覆蓋預設配置。
另外,hive也會讀入hadoop的配置,因為hive是作為hadoop的客戶端啟動的,hive的配置會覆蓋hadoop的配置。
配置檔案的設定對本機啟動的所有hive程序都有效。
bin/hive -hiveconf hive.root.logger=info,console
這一設定對本次啟動的session(對於server方式啟動,則是所有請求的sessions)有效。
set mapred.reduce.tasks=100;
這一設定的作用域也是session級的。
上述三種設定方式的優先順序依次遞增。即引數宣告覆蓋命令列引數,命令列引數覆蓋配置檔案設定。
引數宣告 > 命令列引數 > 配置檔案引數(hive)
注意某些系統級的引數,例如log4j相關的設定,必須用前兩種方式設定,因為那些引數的讀取在session建立以前已經完成了。
Hive Hive中表建立方式及其對比
首先就是最常見的方式,通create table方式進行建立hive表 例如?create external table if not exists tablename column columntype comment annotation column columntype comment an...
深入淺出學Hive Hive引數
第一部分 hive 引數 hive.exec.max.created.files 說明 所有hive執行的map與reduce任務可以產生的檔案的和 預設值 100000 hive.exec.dynamic.partition 說明 是否為自動分割槽 預設值 false hive.mapred.re...
Hive Hive的三種Join方式
hive中的join可分為三種,分別是map join reduce join和smb join,本文簡單介紹這三種join的原理和機制。mapjoin的主要意思就是,當鏈結的兩個表是乙個比較小的表和乙個特別大的表的時候,我們把比較小的table直接放到記憶體中去,然後再對比較大的 進行map操作。...