本來想將hive中的資料用python進行視覺化,在連線時出現了許多問題,特此記錄一下~~~
pip install sasl
pip install thrift
pip install thrift-sasl
pip install pyhive
在linux端啟動hadoop並在任意目錄下輸入:hive --service hiveserver2 啟動服務
在連線的過程中會出現錯誤或者卡住動不了
1.需要在 hive.connection中加入auth='nosasl』引數
from pyhive import hive #匯入包
conn = hive.connection(host=
'ip位址'
,port=
10000
,username=
'***'
,database=
'house'
,auth=
'nosasl'
)#
2.在hive-site.xml中新增hiveserver2 的模式
>
>
hive.server2.authenticationname
>
>
nosaslvalue
>
property
>
重啟hive,大功告成!!!
python連線hive 親測有效
背景 python裡連線hive對應的包是pyhive,但根據hive客戶端的不同的需要引用不同的子模組。部門在hive安裝了hiveserver2,並在centos執行,但在連線的時候出現錯誤module six has no attribute ensure binary 解決問題後進行記錄。1...
python連線hive配置
注 python端所在伺服器為centos6.8 參考博文 重要一點,hive是個客戶端,不是集群,在hive所在節點必須執行如下命令 hive service hiveserver2 參考博文 注 客戶端指的是裝有anaconda的python環境的linux機器,並非裝有hive的機器 以下涉及...
python連線hive配置
注 python端所在伺服器為centos6.8 重要一點,hive是個客戶端,不是集群,在hive所在節點必須執行如下命令 hive service hiveserver2 二,訪問hive的客戶端 以下涉及所有包,1 yum install gcc c 2 yum install python ...