hive實現新使用者計算流程

2021-09-01 13:17:37 字數 1362 閱讀 6592

資料(/hadoopproject1712/18-07-31)

清洗資料(hadoopproject1712.day_users_logs_dis)

資料去重+新增使用者(/hadoopproject1712/newuseradd/18-07-31)

歷史使用者資訊表(hadoopproject1712.his_user_info)

建立乙個新增使用者資訊表(hadoopproject1712.day_new_user_info)

問題1 : his_user_info 這個表裡面沒有資料 (歷史表--第一天沒有資料) 

問題2 : day_users_logs_dis(去重過的資料--老使用者+新使用者) 和 his_user_info(歷史表--老使用者) 得到 每天的新增使用者的資訊表

把新使用者資訊新增到老使用者

迴圈操作即可!!!!!!!!!!!!!!!!!!!!!!

上述操作,我們就實現了乙個新增使用者的明細表 ,只用明細表是不夠的,

得到的是報表,報表都是各種彙總資料

接下來建立乙個彙總表( hadoopproject1712.day_new_user_count)

維度分為 : 渠道(具體渠道/所有渠道),版本(具體版本/所有版本),城市 (具體城市/ 所有城市)

|公司老總,給我11-19日,qq吃雞有多少新使用者?

| qq吃雞在應用寶,上海市 上有多少新使用者?

| 360

| 豌豆莢

| 小公尺**

| …|

|一共有 2 * 2 * 2 = 8種維度需要考慮

| | 1、某一天 某款應用 具體版本 具體渠道 具體城市有多少新增使用者 |

| 2、某一天 某款應用 具體版本 具體渠道 所有城市有多少新增使用者 |

| 3、某一天 某款應用 具體版本 所有渠道 具體城市有多少新增使用者 |

| 4、某一天 某款應用 具體版本 所有渠道 所有城市有多少新增使用者 |

| 5、某一天 某款應用 所有版本 具體渠道 具體城市有多少新增使用者 |

| 6、某一天 某款應用 所有版本 具體渠道 所有城市有多少新增使用者 |

| 7、某一天 某款應用 所有版本 所有渠道 具體城市有多少新增使用者 |

| 8、某一天 某款應用 所有版本 所有渠道 所有城市有多少新增使用者 |

把8種維度彙總到彙總表中!

檢視這個結果一共有多少條新增使用者:

select count(*) from hadoopproject1712.day_new_user_count where datepart=20181119;

結束!!!!!! 得到的就是新增使用者的數量。

建立新使用者

新增新使用者 允許本地 ip 訪問 localhost,127.0.0.1 create user test localhost identified by 123456 允許外網 ip 訪問 create user test identified by 123456 為新使用者分配許可權 授予使用...

新使用者註冊

第一步 新增新好友,實驗步驟5 伺服器端處理新增好友的訊息。if mess.getmessagetype equals message.message addfriend elseelse sendmessage s,mess 傳送到客戶端 第二部 第一張卡片,建立物件 myfriendpanel ...

oracle 建立新使用者

create the user create user personnel manage identified by mwq default tablespace users temporary tablespace temp profile default quota 1024m on sysau...