hive
1、解壓
2、配置(hadoop_home),hive_home等環境變數
3、修改配置檔案hive/conf
>> cp hive-default.xml.template hive-site.xml
>> 修改hive.metastore.schema.verification的值為false
>> 建立hive/tempdata目錄,替換$為該目錄
>> 替換$為root(當前登入的使用者名稱,我使用root登入的)
4、執行 schematool -initschema -dbtype derby 命令
>>會在當前目錄下建立 metastore_db 的資料庫(生產環境中使用mysql儲存metastore的資料)
>>注意!!!下次執行hive時應該還在同一目錄,預設到當前目錄下尋找metastore。
>>遇到問題,把metastore_db刪掉,重新執行命令
5、啟動hive
直接在命令列敲 hive命令 (啟動hive之前一定要啟動hdfs和yarn,因為hive依賴於hdfs和yarn)
hive程式設計指南之資料型別
hive裡有兩種資料型別即 基本資料型別以及集合資料型別 一 基本資料型別 1,tinyint 1byte有符號整數 2,smalint 2byte有符號整數 3,int 4byte有符號整數 4,bigint 8byte有符號整數 5,boolean 布林型別,true或者false 6,floa...
Hive程式設計指南07 索引
hive索引 建立索引 create index tablename index on table col1 as org.apache.hadoop.hive.ql.index.compact.compactindexhandler with deferred rebuild idxpropert...
hive 優化指南
任務任務優化 1分割槽表,掃瞄指定的檔案數,減少處理的檔案 2.對map reduce的輸出進行壓縮,map和reduce,壓縮可以減少io和網路傳輸的時間 set mapred.compress.map.output true 3.桶 4.並行化操作 引數 set hive.exce.parall...