10.資料庫練習
bt.user_visit_log
visit_time(訪問時間)
user_id(賬號id)
page_url(訪問頁量)
2017-03-16 00:59:43
/ad/test1
2017-03-16 01:01:03
/ad/test2
bt.user_register_info
user_id(賬號id)
user_name(賬號名稱)
reg_time(註冊時間)
張三2014-03-16 21:29:56
李四2014-12-12 21:45:56
(1)統計該**每天新註冊的使用者數量
(2)統計賬戶名稱為「王五」的賬戶在2017-03-16當天訪問最多的頁面
(3)統計出2017-03-01到2017-03-16每天訪問量最多的id號
(4)請隨機抽取100個2023年新註冊的賬戶
(5)定義指標**的當月留存率=當月和上月均訪問過**使用者數量/上月訪問過**的使用者數量;統計2023年3月的留存率。
(1)select substr(reg_time,1,10) as curr_date,
count(1) as daily_add_user_count
from bt_user_register_info
group by substr(reg_time,1,10);
(2)select page_url
from
(select
page_url,
vsit_count,
rank() over(order by visit_count) as rk
from
(select
a.page_url,
count(1) as visit_count
from bt_user_visit_log a
left join bt_user_register_info b on a.user_id=b.user_id
where b.user_name=』王五』
and substr(a.visit_time,1,10)=』2017-03-16』
group by a.page_url)c
)d where rk=1
(3)select user_id
from
(select
user_id,
visit_count,
rank() over(order by visit_count) as rk
from
(select
a.user_id,
count(1) as visit_count
from bt_user_visit_log a
left join bt_user_register_info b on a.user_id=b.user_id
where substr(a.visit_time,1,10)>=』2017-03-01』
and substr(a.visit_time,1,10)<=』2017-03-16』
group by a.user_id)c
)d where rk=1
(4) select * from bt_user_register_info where subtr(reg_time,1,4)='2017'order by rand() limit 100;
(5) select count(1) as two_mon_usercount
from
(select
substr(a.visit_time,1,7) as month,
user_id
from bt_user_visit_log
where substr(a.visit_time,1,7)='2017-02'
group by substr(a.visit_time,1,7),user_id)a
join
(select
substr(a.visit_time,1,7) as month,
user_id
from bt_user_visit_log
where substr(a.visit_time,1,7)='2017-03'
group by substr(a.visit_time,1,7),user_id)b on (a.user_id=b.user_id)
select count(distinct user_id) as last_mon_user_count
from bt_user_visit_log
where substr(a.visit_time,1,7)='2017-02'
python資料分析之pandas學習筆記
import pandas as pd import numpy as np from matplotlib import pyplot as plt from matplotlib import font manager plt.rcparams font.sans serif simhei 這句...
資料分析實戰45筆記(11)資料清洗
做完採集資料的工作後要進行的就是資料清洗工作。在資料探勘中,資料清洗就是這樣的前期準備工作。對於資料科學家來說,我們會遇到各種各樣的資料,在分析前,要投入大量的時間和精力把資料 以上資料要直接進行資料分析的話是不可行的。首先這些資料缺少標註。我們在收集整理資料的時候,一定要對資料做標註,資料表頭很重...
資料分析崗筆面經及基礎總結
指令碼語言 計算機網路 資料庫大資料技術 資料探勘技術 機器學習演算法和模型 資料分析常見指標 其他筆面經 在準備面經前有些基礎知識是必不可少的,面經只是平時積累的冰山一角,本文盡量寫出我筆面試過程中遇到的重點難點 每個人的知識儲備不同,見仁見智 千里之行,積於跬步!例項 前中後序互求技巧 邏輯判斷...