昨天有幸參加阿里資料分析實習生的筆試題。在群裡發現好多人的題目多不一樣,應該是從題庫隨機發放的。
總共15題,客觀題和主觀題兩部分,答題時間60min
1、以下演算法對缺失值敏感的模型包括:
a、logistic regression
b、隨機森林
c、樸素貝葉斯
d、c4.5
3、某人賣掉了兩張面值為30元的**卡,均是30元**成交的,其中一張賺了20%,其中一張賠了20%。問他總體是盈利還是虧損,贏/虧多少?
a、不盈不虧
b、盈利2.5元
c、虧損2.5元
d、盈利2元
4、以下場景中,對應使用的挖掘演算法不合適的是:
a、用關聯規則演算法分析購買了羽毛球的買家,是否適合推薦羽毛球鞋
b、根據使用者最近幾年的消費金額資料,用主成分分析法你何處使用者未來乙個月可能的消費金額公式
c、根據使用者最近一年的購物日誌資料,用k-means演算法聚類出**賣家中的高富帥和白富美
d、根據使用者最近購買的商品資訊,用決策數演算法識別出**買家可能是男是女
5、投擲均勻正六面體骰子的熵是:
a、1bit
b、2.6bit
c、3.2bit
d、3.6bit
6、某調查公司接受委託滿意度調查,滿意分數在0~20之間,隨機抽取36名消費者,平均滿意分12,標準差3,在大樣本的假設下,根據調查結果對總體平均的置信區間,結果是:
a、9~15分
b、11~13分
c、12~14分
d、6~18分
7、市場部選擇部分使用者來進行產品a的簡訊推廣,獲取了使用者在時間視窗內是否購買了a產品的資料。資料探勘同學通過這些已知的是否購買資料,用來判斷其他使用者的購買傾向,這在資料探勘中屬於什麼任務?
a、聚類
b、**
c、探索性分析
d、關聯規則
8、如何將乙個excel檔案單元格c2中的手機號13501245678的第四位至第七位隱藏為*
a、=replace(c2,4,4,**)
b、=replace(c2,4,4,」**「)
c、=replace(c2,4,7,」**「)
d、=replace(c2,4,7,**)
9、邏輯回歸中回歸引數可以用以下哪些方法求解?
a、最小二乘法
b、牛頓迭代法
c、蒙特卡洛法
d、似然估計法
10、微軟的excel軟體是強大的資料分析工具,以入門簡單、擴充套件功能強大、視覺化豐富著稱,其中excel圖表是資料分析師最常用的用於展現分析結果的工具,excel圖表選擇描述正確的有:
a、折線圖用來展現資料隨著時間推移而發生變化,並可以**未來的發展趨勢
b、散點圖用來說明同一類別的數個事物中各項的組成比重,或者某一事物隨著時間推移其各個組成的比重變化
c、餅圖主要用來分析內部各個組成部分的佔總體的比重,反映對總體的影響
d、雷達圖主要是對同類別的二組事物在多種專案上的對比
11、請說明隨機森林較一般決策樹穩定的幾點原因。
12、考察sql語句:
有一張交易表a(trade_no為主鍵),一張交易異常表b(trade_no為主鍵),
1)、計算交易表a中的交易總數;
2)、通過關聯表的方式實現a表中去除b表異常交易(保留a中的字段即可)
13、某業務部門在上週結束了為期一周的大促,作為業務對口分析師,需要你對活動進行一次評估,你會從哪幾方面進行分析。
14、世界上每十萬人中就有一人是愛滋病患者。某一種藥物可以幫助檢測愛滋病,如果一人真是愛滋病,可以百分百檢測出來,而如果乙個人沒有愛滋病,它的檢測出錯的概率是1%。請問利用這種檢測藥物,監測正確的概率有多高?
15、閱卷官明天要去爬山,希望正在答卷的你幫他準備個包,裡面放一些必須的物品,請詳述一下你會如何處理。
主要考察,統計學的基本知識、資料探勘常用的十大演算法以及對資料敏感度和思考問題是否全面。
阿里 2020暑期實習生 筆試回憶
給若干點的座標,代表每乙個村子,現在要修一條平行於y軸且無限長的水渠,求所有村莊距離這條水渠垂直長度之和的最小值。include include include include include using namespace std intmain cout minval system pause ...
筆經 騰訊2018暑期實習生 資料分析崗筆試經歷
發現今年雖然很多公司有了資料分析崗位面向本科生開放,但幾乎資料分析師的實習筆試幾乎都沒有考程式設計,注意是幾乎都沒有考!這也給了我們一些啟發,也說明現在的資料分析崗位職能方向更細化。1.同事小鵝在訓練深度學習模型是發現訓練集誤差不斷減小,測試集誤差不斷增大,以下解決方法錯誤的是 過擬合怎麼處理 資料...
阿里巴巴暑期實習生筆試題
1.kmp演算法 長度為n的主串t中匹配長度為m的子串p n m 匹配成功 存在p的每個字元依次和t中的乙個連續字串行相等 輸出主串中匹配串起始位置,匹配失敗輸出 1 思路 首先用o m 的時間對子串進行預處理,可通過子串本身的特性判斷出需要右移幾位才是可能匹配的 然後用o n 的時間去完成匹配 時...