某程:
都用過哪些演算法?應用最熟悉的是那個?
特徵工程如何做?
介紹一下rf吧?
lr相比樹模型對資料有什麼要求?
為什麼有些演算法需要剔除共線性?
距離演算法了解哪些?余弦相似性相比k-means有什麼區別?
k-means的k如何選擇的?聚類的效果如何評估?
為什麼距離演算法需要對資料進行歸一化?樹模型需要嗎?為什麼不需要?
樹模型特徵如何選擇?
決策樹如何處理缺失值?
介紹一下最常用的整合演算法?
rf可以對特徵進行重要性評估的原理?
某東:
lr的損失函式是什麼?
交叉熵損失函式的表示式是什麼?
不平衡資料如何處理?
如何消除過擬合?
l1和l2正規化分別要求的資料分布是什麼?
介紹一下adaboost和gbdt、xgboost的區別?
adaboost對分錯的樣本給予更小的權重還是更大的權重?如何更新權重?
模型評估方法有哪些?業務上如何評估?
介紹一下roc曲線?和p-r曲線的區別?
p-r曲線為什麼不能很好評估不均衡資料?
介紹一下a/btest?業務上如何實施的?
介紹一下極大似然估計?
對後驗概率了解多少?
了解深度學習嗎?前沿的一些演算法了解哪些?
cnn和rnn相比dnn有什麼區別?
哪些神經網路結構會發生權重共享?
為什麼會出現梯度消失?
用過哪些深度學習框架?
平時都瀏覽什麼**?前沿知識主要獲取途徑是什麼?
某里:
資料分析和資料探勘有什麼區別?
整合演算法有哪些?分別介紹一下?
哪種模型最好?
什麼是貝葉斯定理?樸素貝葉斯樸素在**?
哪些演算法容易過擬合?如何處理過擬合?
l1、l2正則之間有什麼不同?
決策樹演算法對資料有什麼要求?
決策樹的整個構建過程?
決策樹有哪些特徵選擇方法?區別是什麼?
決策樹如何進行剪枝?那種方法好?
整合學習為什麼能夠提高精度?除此之外還有什麼優點?
完整介紹一下adaboost?
更關注模型的精度還是模型的效能?如何均衡?
深度學習都了解哪些?詳細介紹一下?
神經網路演算法如何防止過擬合?
詳細介紹一下dropout?
排序演算法都有哪些?時間複雜度區別?
設計乙個黑箱的文字分析器?說出思路即可
某滴:
特徵工程進行了哪些處理?
正樣本太少如何處理?
都嘗試過哪些方法豐富正樣本?
1:10的資料和1:1000的資料如何選擇?如何處理?
使用者裂變的時候如何應對重複裂變?
模型效果如何評估?在實際業務上如何評估?
如何降低過擬合?
auc除了通過roc曲線來計算,還有沒有別的計算方法?如何計算的?
決策樹有幾種?幾種特徵選擇方法介紹一下?有什麼區別?
rf、adaboost、xgboost分別介紹一下?區別是什麼?哪種演算法好?
bagging和boosting更偏向於哪個指標?偏差還是方差?
rf相比adaboost哪種決策樹比較深?為什麼?
xgboost和gbdt的區別?
聚類演算法用過哪些?介紹一下kmeans?其它聚類演算法了解嗎?
推薦演算法都有哪些?介紹一下協同過濾?
求 f (x
)=12
(x+a
)2+∣
x∣
f(x)=\frac(x+a)^+|x|
f(x)=2
1(x
+a)2
+∣x∣
的極值點及極值?
某美:
如何進行資料處理?
如何進行特徵降維?
整合學習演算法都用過哪些?整合學習的原理是什麼?
介紹一下rf吧?它和其它整合學習演算法有什麼區別?
不均衡資料如何處理?
模型如何評估?
介紹一下roc曲線?為什麼需要auc?
rou曲線和p-r曲線區別?
聚類演算法如何確定聚類群體個數?
用過深度學習演算法嗎?介紹一下常用的深度學習演算法?
視覺化實現?用過哪些模組?
手推一下lr?
時間序列模型了解嗎?缺失資料如何基於時間序列補齊?
某來:
spark相比hadoop有什麼區別?
spark的優點和不足?
有哪些集群資源管理方式?用過哪些?
spark的standalone和yarn模式的區別?
模型評估方法有哪些?實際工作中如何評估?
小樣本學習了解嗎?介紹一下
不均衡資料如何處理?
介紹一下整合學習演算法?
xgboost和gbdt的區別?
優化方法有哪些?分別介紹一下
svm用過嗎?損失函式是什麼?是凸的嗎?
解釋對偶的概念?為什麼需要對偶?
lr損失函式是什麼?是凸的嗎?
聚類演算法如何確定聚類數量?如何評估?
密度聚類了解嗎?
正則化了解嗎?
l1範數為什麼會輸出稀疏矩陣?l2為什麼不會?
什麼是拉普拉斯分布?什麼是高斯分布?兩者的區別?
精準營銷場景,更偏向於給人推物?還是給物找人?
歡迎補充。
最後,專案覆盤很重要,知識覆盤也很重要。
stay hungry, stay foolish.
最近遇到的幾個面試題
一 物件導向的三大特徵。繼承 封裝 多型。b 封裝 b 封裝機制將資料和 到一起,避免了外界的干擾和不確定性。它同樣允許建立物件。簡單的說,乙個物件就是乙個封裝了資料和操作這些資料的 的邏輯實體。在乙個物件內部,某些 和 或 某些資料可以是私有的,不能被外界訪問。通過這種方式,物件對內部資料提供了不...
記幾個演算法面試題
最近去面試,遇到很多演算法類的題目,看的是一臉懵,故特此記錄下了此份試題,慢慢去研究裡面的問題。1 乙個整數,大於0,不用迴圈和本地變數,按照n,2n,4n,8n的順序遞增,當值大於5000時,把值按照指定順序輸出來。例 n 1237 則輸出為 1237,2474,4948,9896,9896,49...
2019前端面試大廠面試題
後面題目是我從各大廠面試題總結的一些經驗 需要key的原因是 使用v for更新已經渲染的元素列表時,預設採用 就地復用 策略,列表中資料發生改變時,此時的key就開始工作,根據key值去判斷某個值是否被修改,如果修改了的話,則重新渲染這一項,否則復用之前的元素 根據這個原因,我們可以知道,key值...