2017 04 19 今日頭天資料分析筆試02

2021-07-30 19:54:59 字數 2409 閱讀 5044

10.資料庫練習

bt.user_visit_log

visit_time(訪問時間)

user_id(賬號id)

page_url(訪問頁量)

2017-03-16 00:59:43

/ad/test1

2017-03-16 01:01:03

/ad/test2

bt.user_register_info

user_id(賬號id)

user_name(賬號名稱)

reg_time(註冊時間)

張三2014-03-16 21:29:56

李四2014-12-12 21:45:56

(1)統計該**每天新註冊的使用者數量

(2)統計賬戶名稱為「王五」的賬戶在2017-03-16當天訪問最多的頁面

(3)統計出2017-03-01到2017-03-16每天訪問量最多的id號

(4)請隨機抽取100個2023年新註冊的賬戶

(5)定義指標**的當月留存率=當月和上月均訪問過**使用者數量/上月訪問過**的使用者數量;統計2023年3月的留存率。

(1)select substr(reg_time,1,10) as curr_date, 

count(1) as daily_add_user_count

from bt_user_register_info

group by substr(reg_time,1,10);

(2)select page_url

from

(select

page_url,

vsit_count,

rank() over(order by visit_count) as rk

from

(select

a.page_url,

count(1) as visit_count

from bt_user_visit_log a

left join bt_user_register_info b on a.user_id=b.user_id

where b.user_name=』王五』

and substr(a.visit_time,1,10)=』2017-03-16』

group by a.page_url)c

)d where rk=1

(3)select user_id

from

(select

user_id,

visit_count,

rank() over(order by visit_count) as rk

from

(select

a.user_id,

count(1) as visit_count

from bt_user_visit_log a

left join bt_user_register_info b on a.user_id=b.user_id

where substr(a.visit_time,1,10)>=』2017-03-01』

and substr(a.visit_time,1,10)<=』2017-03-16』

group by a.user_id)c

)d where rk=1

(4) select * from bt_user_register_info where subtr(reg_time,1,4)='2017'order by rand() limit 100;

(5) select count(1) as two_mon_usercount

from

(select

substr(a.visit_time,1,7) as month,

user_id

from bt_user_visit_log

where substr(a.visit_time,1,7)='2017-02'

group by substr(a.visit_time,1,7),user_id)a

join

(select

substr(a.visit_time,1,7) as month,

user_id

from bt_user_visit_log

where substr(a.visit_time,1,7)='2017-03'

group by substr(a.visit_time,1,7),user_id)b on (a.user_id=b.user_id)

select count(distinct user_id) as last_mon_user_count

from bt_user_visit_log

where substr(a.visit_time,1,7)='2017-02'

python資料分析之pandas學習筆記

import pandas as pd import numpy as np from matplotlib import pyplot as plt from matplotlib import font manager plt.rcparams font.sans serif simhei 這句...

資料分析實戰45筆記(11)資料清洗

做完採集資料的工作後要進行的就是資料清洗工作。在資料探勘中,資料清洗就是這樣的前期準備工作。對於資料科學家來說,我們會遇到各種各樣的資料,在分析前,要投入大量的時間和精力把資料 以上資料要直接進行資料分析的話是不可行的。首先這些資料缺少標註。我們在收集整理資料的時候,一定要對資料做標註,資料表頭很重...

資料分析崗筆面經及基礎總結

指令碼語言 計算機網路 資料庫大資料技術 資料探勘技術 機器學習演算法和模型 資料分析常見指標 其他筆面經 在準備面經前有些基礎知識是必不可少的,面經只是平時積累的冰山一角,本文盡量寫出我筆面試過程中遇到的重點難點 每個人的知識儲備不同,見仁見智 千里之行,積於跬步!例項 前中後序互求技巧 邏輯判斷...