資料模型工程師筆試題目
一、基礎資料能力考察
1、網際網路和傳統行業數倉的差異?(選做)
2、雪花模型與星型模型的差別?(選做)
3、有如下表:table_user,表的內容包含:member_id、id_card、id_card_name。
(1)取id_card,id_card_name重複值。(2)取top5與後top5。
4、按要求寫sql:表a如下,
user_id(id,字元型別)
login_time(字元時間型別,只包含一天的資料)
item(訪問頁面位址,字元型)
要求:取出每個使用者訪問的第乙個item(按時間最早)形成新錶b,表b的結構和a一樣。
二、不定項選擇題
10道選擇題目10、維歸約常用的處理技術有()
a、主成分分析
b、特徵提取、
c、奇異值分解
d、特徵加權
e、離散化
三、概念題目等考察
1、異常值是什麼,列舉至少3中識別連續變數異常值方法?
2、準確率,召回率,f1值計算公式,他們和roc曲線的關係?
3、過擬合和欠擬合產生的原因,如何解決?
4、一道python使用numpy的程式優化題目,題目給出一段**,提示為向量化計算
。
5、為何不用邏輯回歸演算法,為什麼選擇gbm演算法?
6、什麼樣的資料集不適合深度學習?
7、試著設計乙個3層神經網路,寫出前向傳播過程,什麼造成梯度消失問題,試著推導一下?
2023年校招 萬得資訊AI演算法工程師
分為筆試與面試 筆試題目 請描述 如何選取資料 資料預處理 構造特徵 選擇演算法,以及如何對效果進行評估?答 理論 理解實際問題,抽象為機器學習能處理的數學問題 理解實際業務場景問題是機器學習的第一步,機器學習中特徵工程和模型訓練都是非常費時的,深入理解要處理的問題,能避免走很多彎路。理解問題,包括...
2017盛大遊戲2017前端工程師校招筆試題總結
1.js的陣列方法中,哪些方法不改變陣列自身?改變陣列自身 pop push shift unshift reverse splice sort 不改變陣列,返回相應值 join slice concat map filter some every reduce reduceright 不改變陣列自...
2023年阿里巴巴校招研發工程師程式設計題
2 給定乙個query和乙個text,均由小寫字母組成。要求在text中找出以同樣的順序連續出現在query中的最長連續字母序列的長度。例如,query為 acbac text為 acaccbabb 那麼text中的 cba 為最長的連續出現在query中的字母序列,因此,返回結果應該為其長度3。請...