機器學習與深度學習的區別
解決過擬合的方法有哪些?什麼情況下一定會發生過擬合?
解釋一下過擬合和欠擬合,有哪些方法防止過擬合。
機器學習:幾種樹模型的原理和對比,樸素貝葉斯分類器原理以及公式,出現估計概率值為 0 怎麼處理(拉普拉斯平滑),缺點;
如何構造決策樹、計算資訊熵和資訊增益、說明c4.5 、id3、 cart的區別及優缺點
boost,bagging、adaboost、boosting區別在哪?
詳細討論了樣本取樣和bagging的問題
說一下adaboost,權值更新公式。當弱分類器是lr時,每個樣本的的權重是w1,w2...,寫出最終的決策公式。
決策樹原理;決策樹處理連續值的方法;決策樹如何防止過擬合;決策樹過擬合哪些方法,前後剪枝。
rf, gbdt, xgboost,lr的區別,優缺點?
l2懲罰項是怎麼減小overfitting的?l1,l2等範數的通式是?差別是?在什麼場景下用什麼範數?l1在0處不可導,怎麼處理?
說明l1和l2正則的效果與為什麼形成這種情況(l1正則稀疏,l2正則平滑,之後說明就是畫圖說明正則化)
l1和l2函式?l1和l2正則項的比較,如何解決 l1 求導困難?
l1正則為何可把係數壓縮成0,說明座標下降法的具體實現細節
logistics與隨機森林比較.邏輯回歸估計引數時的目標函式
邏輯回歸的值表示概率嗎?線性回歸與邏輯回歸區別?
logistics(理論推導);logistic回歸的推導,如何得到objective function?手寫邏輯回歸(損失函式及更新方式推導)
svm與隨機森林的差別?
svm為何要引入拉格朗日的優化方法?
svm原問題和對偶問題關係?
svm在哪個地方引入的核函式, 如果用高斯核可以公升到多少維。
svm如何防止過擬合?
svm的目標函式?常用的核函式有哪些?
svm的過程,理論推導。手寫svm硬軟間隔對偶的推導
聊聊svm,這段說了好久,從基本的線性可分到不可分,相關公升維,各種核函式,每個是如何實現公升。以及出現了xx問題,分析是樣本的原因還是其他原因。針對不同情況,採取什麼解決方案較好。
lr為什麼用sigmoid函式。這個函式有什麼優點和缺點?為什麼不用其他函式?
lr和svm的區別?libsvm和liblinear的區別?
em 與 k-means 的關係?手寫k-means的偽**。
k-means演算法中的k如何選取?
k-means演算法初始點怎麼選擇?
k-means的原理,優缺點以及改進。
k折交叉驗證中k取值多少有什麼關係?
最近鄰演算法knn(分類與回歸)
分類模型可做回歸分析嗎?反過來可以嗎?
分類模型和回歸模型的區別?
差別常見分類模型( svm,決策樹,貝葉斯等)的優缺點,適用場景以及如何選型
各個模型的loss function,牛頓學習法、sgd如何訓練。
有哪些常見的分類器,簡單介紹下原理
對於同分布的弱分類器,求分類器均值化之後的分布的均值跟方差。
bp演算法原理
改變隨機森林的訓練樣本資料量,是否會影響到隨機森林學習到的模型的複雜度?
資料探勘各種演算法,以及各種場景下的解決方案
是否了解mutual infomation、chi-square、lr前後向、樹模型等特徵選擇方式。
是否了解線性加權、bagging、boosting、cascade等模型融合方式
梯度下降、牛頓、擬牛頓演算法的原理
梯度下降的優缺點。隨機梯度下降,標準梯度.
牛頓法、隨機梯度下降演算法和直接梯度下降演算法的區別?
牛頓法推導,牛頓法原理和適用場景,有什麼缺點,如何改進(擬牛頓法)
梯度下降法的原理以及各個變種(批量梯度下降,隨機梯度下降法,mini 梯度下降法),以及這幾個方法會不會有區域性最優問題。
選個你熟悉的機器學習方法 ,著重介紹一下產生原因,推導公式,背後統計意義什麼等等。會哪些機器學習演算法?資訊熵公式?
資料探勘的基礎知識,包括svm,邏輯回歸、em、k-means等,然後給出很多場景問你遇到這些情況你如何處理資料,怎麼進行建模等
優化演算法中常遇到的kkt條件?作用是?
深度學習有很大部分是cnn,給他用通俗的語言解釋下卷積的概念,解釋下cnn中的優勢及原因
判別模型和生成模型?
特徵選擇方法有哪些
dbscan聚類演算法原理
由資料引申到資料不平衡怎麼處理(10w正例,1w負例,牛客上有原題)
為什麼要做資料歸一化?資料歸一化的方式
貝葉斯估計?
BAT面試經驗分享(機器學習演算法崗)
阿里 對於大資料方面的問題可參考 二面 相隔時間有三周左右,本來以為沒戲了 二面是個大叔,問了專案中的fm和ffm的區別 參考問的主要是專案上的,問了天池大資料比賽的一些問題,因為說了平時會關注最新技術動態,因為就叫我舉個例子,剛好看過微軟識花的那篇文章就好好講了下。最後問了下工作地啥的。二面就40...
5 16 微軟 機器學習崗
一 單詞反轉 將字串單詞反轉輸出,例如 str how are you output you are how 二 s1和s2兩個字串,查詢兩個字串中的共用子串 三 遍歷二叉樹,從左到右分別展示,從葉子節點向根節點分別展示 用遞迴方法實現中序遍歷 四 n皇后問題 五 都了解什麼深層神經網路,分別運用在...
2017暑期實習面試總結 機器學習演算法崗
雖然心裡念叨該早點準備3月開始的這波面試,但由於生病等種種原因,又或者可以說我是乙個輕微拖延症患者吧,直到3月初被內推了阿里才真正開始準備。截止目前,還算幸運,拿到了幾個offer。就先行做乙個總結吧,算是對這乙個半月的小記了。阿里 螞蟻金服風控部門,機器學習演算法崗。3.2 一面,杭州螞蟻金服,1...