SPARK SQL連續三天登入的使用者

2021-10-23 13:06:43 字數 695 閱讀 7222

sid,dt,money

shop1,2019-01-18,500

shop1,2019-02-10,500

shop1,2019-02-10,200

shop1,2019-02-11,600

shop1,2019-02-12,400

shop1,2019-02-13,200

shop1,2019-02-15,100

shop1,2019-03-05,180

shop1,2019-04-05,280

shop1,2019-04-06,220

shop2,2019-02-10,100

shop2,2019-02-11,100

shop2,2019-02-13,100

shop2,2019-03-15,100

shop2,2019-04-15,100

求連續三天登入的使用者

解析:使用視窗函式,將dt-視窗函式,相等的dt就為連續登入的使用者

先開窗,然後用date_sub相減,得出相同的天數,然後分割槽id和得出的天數,

package com._51doit.spark.day12s

import org.apache.spark.sql.sparksession

object threedaylogin

}

連續N天登入的資料獲取 hive

1 獲取使用者連續登入天數 整合源表,保證乙個使用者每天一條記錄 drop table if exists xxnisj1112 uid basic create table xxnisj1112 uid basic as select uid,pt day from oss bi all user...

python計算連續登入天數或者多少天沒登入

最近有個需求,需要計算使用者多少天沒登入 我想出來的思路是 1.從資料庫中獲取使用者最新的登入時間 2.獲取今天的時間 3.用今天的時間減去使用者最新的登入時間,這樣就可以獲取到多少天沒登入了,或者說是有沒有連續登入 需要注意的是,這裡都得換成時間戳來計算 不然遇到跨月或者跨年的時候會出問題 那麼就...

hive實現連續N天登入使用者計算

三 計算連續7天的使用者列表 四 按照連續登入天數分組檢視使用者分布總結無 無具體hive是什麼,能幹啥,本文不做過多闡述,具體可以檢視 aapache hive 的官方使用者文件。假設有表 tmp user login 分割槽表記錄使用者每天的登入資訊,有欄位user id,last day,分割...