sid,dt,money
shop1,2019-01-18,500
shop1,2019-02-10,500
shop1,2019-02-10,200
shop1,2019-02-11,600
shop1,2019-02-12,400
shop1,2019-02-13,200
shop1,2019-02-15,100
shop1,2019-03-05,180
shop1,2019-04-05,280
shop1,2019-04-06,220
shop2,2019-02-10,100
shop2,2019-02-11,100
shop2,2019-02-13,100
shop2,2019-03-15,100
shop2,2019-04-15,100
求連續三天登入的使用者
解析:使用視窗函式,將dt-視窗函式,相等的dt就為連續登入的使用者
先開窗,然後用date_sub相減,得出相同的天數,然後分割槽id和得出的天數,
package com._51doit.spark.day12s
import org.apache.spark.sql.sparksession
object threedaylogin
}
連續N天登入的資料獲取 hive
1 獲取使用者連續登入天數 整合源表,保證乙個使用者每天一條記錄 drop table if exists xxnisj1112 uid basic create table xxnisj1112 uid basic as select uid,pt day from oss bi all user...
python計算連續登入天數或者多少天沒登入
最近有個需求,需要計算使用者多少天沒登入 我想出來的思路是 1.從資料庫中獲取使用者最新的登入時間 2.獲取今天的時間 3.用今天的時間減去使用者最新的登入時間,這樣就可以獲取到多少天沒登入了,或者說是有沒有連續登入 需要注意的是,這裡都得換成時間戳來計算 不然遇到跨月或者跨年的時候會出問題 那麼就...
hive實現連續N天登入使用者計算
三 計算連續7天的使用者列表 四 按照連續登入天數分組檢視使用者分布總結無 無具體hive是什麼,能幹啥,本文不做過多闡述,具體可以檢視 aapache hive 的官方使用者文件。假設有表 tmp user login 分割槽表記錄使用者每天的登入資訊,有欄位user id,last day,分割...