一、命令列客戶端工具:
hivecli
cli是和hive互動的最簡單/最常用方式,你只需要在乙個具備完整hive環境下的shell終端中鍵入hive即可啟動服務。
beeline
beeline是hive新的命令列客戶端工具。
hive客戶端工具後續將使用beeline 替代hivecli ,並且後續版本也會廢棄掉hivecli 客戶端工具。
beeline是從 hive 0.11版本引入的。
beeline工作模式有兩種,即本地嵌入模式和遠端模式。嵌入模式情況下,它返回乙個嵌入式的hive(類似於hive cli)。而遠端模式則是通過thrift協議與某個單獨的hiveserver2程序進行連線通訊。
下面給乙個簡單的登入beeline的使用例項:
退出beeline命令列則是!quit, 很多命令都是前面需要加乙個感嘆號, 但對於登入了後的ddl,dml,則直接執行sql語句即可,語句後帶上乙個分號,然後回車執行。
二、python遠端連線:
需要裝包:
pip install impyla
pip install thrift==0.9.3
from impala.dbapi import connect
def connhive():
conn = connect(host='192.168.1.54', port=10000, auth_mechanism='plain', user='hdfs', password='hdfs')
cur = conn.cursor()
使用PyHive連線Hive資料倉儲
pyhive是python語言編寫的用於操作hive的簡便工具庫。from pyhive import hive conn hive.connection host 192.168.0.1 port 10000 auth custom database gld username hive passw...
Hive 資料倉儲
hive命令列模式 1 進入bin 執行.hiv 2 配置hive環境變數,直接執行命令 hive service cli 或 hive hive的web模式 執行hive service hwi 啟動後訪問http master 9999 hwi hive的遠端服務 預設埠 10000,執行啟動命...
資料倉儲Hive
資料倉儲是乙個面向主題的 整合的 相對穩定的 反映歷史變化的資料集合,用於支援管理決策。根本目的是為了支援企業內部的商業分析和決策,基於資料倉儲的分析結果,做出相關的經營決策.資料倉儲中的資料比較穩定,保留了大量歷史資料 而資料庫只儲存某一時刻的資料.對於傳統資料倉儲來說,既是資料儲存產品也是分析產...