要求:
根據所給資料,統計掉話率前十的基站。資料格式如下
掉話率:掉話率,是移動通訊中的重要指標,也稱通話中斷率,是指在移動通訊的過程中,通訊意外中斷的機率。本例的計算方法 掉話率=掉話時長/通話總時長。
資料格式:
資料條數:976306條。大小:54.7mb。
關鍵字段介紹:
imei:基站編號
cell:手機編號
drop_num:掉話的秒數
duration:通話持續總秒數
思路:
1.建立儲存原始資料的表droprate和存放統計結果的表droprate_result。
2.對droprate進行按imei進行分組,然後求總掉話時長和總共通話時長,和掉話率。
3.對3的結果進行按照掉話率降序排列,結果存放到droprate_result表。
4.查詢前10條記錄。
具體實現:
create
table droprate(
record_time string,
imei string,
cell string,
ph_num int
,call_num int
,drop_num int
,duration int
,drop_rate int
,net_type string,
erl int
)row format delimited
fields
terminated
by','
;create
table droprate_result(
imei string,
drop_num int
,duration int
,rate double);
from droprate
insert
into
table droprate_result
select imei,
sum(drop_num)
,sum
(duration)
,sum
(drop_num)
/sum
(duration) rate group
by imei order
by rate desc
;
結果展示: hive分析的小練習
一 題目 指標分析案例 1 需求 統計每天24小時每小時的pv和uv數 2 分析 pv count url uv count distinct guid 3 資料採集 建庫create database example 建表 源表 create table log src id string,url...
Hive小練習實現單詞統計
su l hadoop 輸入密碼 vi word.txt 新建乙個word.txt文件,作為我們的資料檔案 輸入一些詞彙,以 為分隔符 hello world hello terese hello myfriend hello everyone esc wq儲存退出 hive 回到hive命令列中 ...
hive練習資料
create table student sno int,sname string,string,sage int,sdept string row format delimited fields terminated by stored as textfile create table cours...