啟動hadoop
start-all.sh啟動hive
./hive載入hcatalog包,此包已經包含在hive中
add jar hive目錄/hcatalog/share/hcatalog/hive-hcatalog-core-1.2.0.jar;準備一批json資料
將資料複製在乙個檔案裡面取名:test01.json.,,,,,,,,,,,,,,,,
建立test資料庫
create database testdb;#載入資料use jydb;
#建立可以處理json格式資料的表
create table test01 if not exists jsontest
(rate string,
cover_x double,
title string,
url string,
playable booliean,
cover string,
id string,
cover_y double,
is_new boolean)
row format serde 'org.apache.hive.hcatalog.data.jsonserde'
stored as textfile;
load data local inpath '/root/test01.json' into table test01;我們可以檢視一下我們的**
select * from test01;發現所有資料都進來了
hive儲存複雜的json格式
1.hive復合資料型別 array data type map primitive type,data type struct col name data type comment col comment 2.json建構於兩種結構 名稱 值 對的集合 a collection of name v...
hive儲存格式
textfile 預設格式,行儲存,匯入資料時直接把資料檔案拷貝到hdfs的hive表目錄 hive location 資料檔案可先經過gzip等壓縮,再導hive表 系統自動檢查,執行查詢時自動解壓 但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作.優點 資料載入快 load...
Hive儲存格式
hive的四種儲存格式 textfile sequencefile rcfile parquet 列式儲存和行式儲存的比較 優點缺點 行式儲存 一行資料是一條記錄,放在同乙個block塊中 只查詢幾個列時,也會讀取整行的資料,當資料量大時,影響效能 方便進行insert update操作 不同型別的...