第八次 Hive 操作與應用 詞頻統計

2022-07-11 06:54:10 字數 2041 閱讀 1050

一、hive用本地檔案進行詞頻統計

1.準備本地txt檔案 

echo "hadoop hbase" > f1.txt

echo "hadoop hive" > f2.txt

2.啟動hadoop,啟動hive

3.建立資料庫,建立文字表 

use hive(建立資料庫,選擇資料庫)

4.對映本地檔案的資料到文字表中

5.hql語句進行詞頻統計交將結果儲存到結果表中。

select word,count(1) as count from (select explode(split(line,'

')) as word from wctext) w group by word order by word;

create table wc as select word,count(1) as count from (select explode(split(line,'

')) as word from wctext) w group by word order by word;

6.檢視統計結果

二、hive用hdfs上的檔案進行詞頻統計

1.準備電子書或其它大的文字檔案

2.將文字檔案上傳到hdfs上

hdfs dfs -put story.txt  input/wchive/
3.建立文字表

create table docs(line string);
4.對映hdfs中的檔案資料到文字表中

5.hql語句進行詞頻統計交將結果儲存到結果表中

6.檢視統計結果

第八次作業 Hive 操作與應用 詞頻統計

一 hive用本地檔案進行詞頻統計 1.準備本地txt檔案 2.啟動hadoop,啟動hive 3.建立資料庫,建立文字表 4.對映本地檔案的資料到文字表中 5.hql語句進行詞頻統計交將結果儲存到結果表中。6.檢視統計結果 二 hive用hdfs上的檔案進行詞頻統計 1.準備電子書或其它大的文字檔...

作業八Hive 操作與應用 詞頻統計

一 hive用本地檔案進行詞頻統計 1.準備本地txt檔案 2.啟動hadoop,啟動hive 3.建立資料庫,建立文字表 4.對映本地檔案的資料到文字表中 5.hql語句進行詞頻統計交將結果儲存到結果表中。6.檢視統計結果 二 hive用hdfs上的檔案進行詞頻統計 1.準備電子書或其它大的文字檔...

Hive 操作與應用 詞頻統計

一 hive用本地檔案進行詞頻統計 1.準備本地txt檔案 2.啟動hadoop,啟動hive 3.建立資料庫,建立文字表同時對映本地檔案的資料到文字表中 4.hql語句進行詞頻統計交將結果儲存到結果表中。5.儲存並且檢視統計結果 二 hive用hdfs上的檔案進行詞頻統計 1.準備電子書或其它大的...