Hive 配置牛刀小試

1）linux 6.4

2）jdk 1.8.0_201

3）hadoop 2.7.3

4）apache-hive-1.2.1-bin.tar.gz

5）mysql 5.x

hive是基於hadoop的乙個資料倉儲工具，可以將結構化的資料檔案對映為一張資料庫表，並提供簡單的sql查詢功能，可以將sql語句轉換為mapreduce任務進行執行。其優點是學習成本低，可以通過類sql語句快速實現簡單的mapreduce統計，不必開發專門的mapreduce應用，十分適合資料倉儲的統計分析。

將sql語句轉換成mapreduce程式，並且提交到yarn上執行，讀取hdfs上的資料進行處理。

1）上傳、解壓、重新命名

2）修改配置檔案

hive-env.sh

重新命名

mv hive-env.sh.template hive-env.sh

修改：

3)建立資料倉儲

hive 的資料需要儲存到hdfs，hive會去讀預設路徑，但是這些目錄是空，需要去建立

4)基本使用

啟動互動式命令：bin/hive

1)準備資料上傳到linux中

tb_word.sql

zs 1 ls 1 zs 1 wu 2 zs 1 wu 8 ml 1 zs 1

2)進入hive互動命令

使用default建立資料表

create table tb_word( word string, count int )row format delimited fields terminated by '\t' lines terminated by '\n'; drop table if exists tb_word

3)載入資料到資料庫

load data local inpath '/opt/datas/tb_word.sql' into table tb_word;

4)測試

select
word,count(count) count
from tb_word
group by word

結果：

Hive 配置牛刀小試

nodejs 牛刀小試

查詢牛刀小試

dynamic 牛刀小試

Hive 配置 牛刀小試

nodejs 牛刀小試

查詢 牛刀小試

dynamic 牛刀小試

相關推薦

Hive 配置牛刀小試

查詢牛刀小試