機器學習演算法崗備考

2021-09-23 20:23:18 字數 2263 閱讀 4194

機器學習與深度學習的區別

解決過擬合的方法有哪些?什麼情況下一定會發生過擬合?

解釋一下過擬合和欠擬合,有哪些方法防止過擬合。

機器學習:幾種樹模型的原理和對比,樸素貝葉斯分類器原理以及公式,出現估計概率值為 0 怎麼處理(拉普拉斯平滑),缺點;

如何構造決策樹、計算資訊熵和資訊增益、說明c4.5 、id3、 cart的區別及優缺點

boost,bagging、adaboost、boosting區別在哪?

詳細討論了樣本取樣和bagging的問題

說一下adaboost,權值更新公式。當弱分類器是lr時,每個樣本的的權重是w1,w2...,寫出最終的決策公式。

決策樹原理;決策樹處理連續值的方法;決策樹如何防止過擬合;決策樹過擬合哪些方法,前後剪枝。

rf, gbdt, xgboost,lr的區別,優缺點?

l2懲罰項是怎麼減小overfitting的?l1,l2等範數的通式是?差別是?在什麼場景下用什麼範數?l1在0處不可導,怎麼處理?

說明l1和l2正則的效果與為什麼形成這種情況(l1正則稀疏,l2正則平滑,之後說明就是畫圖說明正則化)

l1和l2函式?l1和l2正則項的比較,如何解決 l1 求導困難?

l1正則為何可把係數壓縮成0,說明座標下降法的具體實現細節

logistics與隨機森林比較.邏輯回歸估計引數時的目標函式

邏輯回歸的值表示概率嗎?線性回歸與邏輯回歸區別?

logistics(理論推導);logistic回歸的推導,如何得到objective function?手寫邏輯回歸(損失函式及更新方式推導)

svm與隨機森林的差別?

svm為何要引入拉格朗日的優化方法?

svm原問題和對偶問題關係?

svm在哪個地方引入的核函式, 如果用高斯核可以公升到多少維。

svm如何防止過擬合?

svm的目標函式?常用的核函式有哪些?

svm的過程,理論推導。手寫svm硬軟間隔對偶的推導

聊聊svm,這段說了好久,從基本的線性可分到不可分,相關公升維,各種核函式,每個是如何實現公升。以及出現了xx問題,分析是樣本的原因還是其他原因。針對不同情況,採取什麼解決方案較好。

lr為什麼用sigmoid函式。這個函式有什麼優點和缺點?為什麼不用其他函式?

lr和svm的區別?libsvm和liblinear的區別?

em 與 k-means 的關係?手寫k-means的偽**。

k-means演算法中的k如何選取?

k-means演算法初始點怎麼選擇?

k-means的原理,優缺點以及改進。

k折交叉驗證中k取值多少有什麼關係?

最近鄰演算法knn(分類與回歸)

分類模型可做回歸分析嗎?反過來可以嗎?

分類模型和回歸模型的區別?

差別常見分類模型( svm,決策樹,貝葉斯等)的優缺點,適用場景以及如何選型

各個模型的loss function,牛頓學習法、sgd如何訓練。

有哪些常見的分類器,簡單介紹下原理

對於同分布的弱分類器,求分類器均值化之後的分布的均值跟方差。

bp演算法原理

改變隨機森林的訓練樣本資料量,是否會影響到隨機森林學習到的模型的複雜度?

資料探勘各種演算法,以及各種場景下的解決方案

是否了解mutual infomation、chi-square、lr前後向、樹模型等特徵選擇方式。

是否了解線性加權、bagging、boosting、cascade等模型融合方式

梯度下降、牛頓、擬牛頓演算法的原理

梯度下降的優缺點。隨機梯度下降,標準梯度.

牛頓法、隨機梯度下降演算法和直接梯度下降演算法的區別?

牛頓法推導,牛頓法原理和適用場景,有什麼缺點,如何改進(擬牛頓法)

梯度下降法的原理以及各個變種(批量梯度下降,隨機梯度下降法,mini 梯度下降法),以及這幾個方法會不會有區域性最優問題。

選個你熟悉的機器學習方法 ,著重介紹一下產生原因,推導公式,背後統計意義什麼等等。會哪些機器學習演算法?資訊熵公式?

資料探勘的基礎知識,包括svm,邏輯回歸、em、k-means等,然後給出很多場景問你遇到這些情況你如何處理資料,怎麼進行建模等

優化演算法中常遇到的kkt條件?作用是?

深度學習有很大部分是cnn,給他用通俗的語言解釋下卷積的概念,解釋下cnn中的優勢及原因

判別模型和生成模型?

特徵選擇方法有哪些

dbscan聚類演算法原理

由資料引申到資料不平衡怎麼處理(10w正例,1w負例,牛客上有原題)

為什麼要做資料歸一化?資料歸一化的方式

貝葉斯估計?

BAT面試經驗分享(機器學習演算法崗)

阿里 對於大資料方面的問題可參考 二面 相隔時間有三周左右,本來以為沒戲了 二面是個大叔,問了專案中的fm和ffm的區別 參考問的主要是專案上的,問了天池大資料比賽的一些問題,因為說了平時會關注最新技術動態,因為就叫我舉個例子,剛好看過微軟識花的那篇文章就好好講了下。最後問了下工作地啥的。二面就40...

5 16 微軟 機器學習崗

一 單詞反轉 將字串單詞反轉輸出,例如 str how are you output you are how 二 s1和s2兩個字串,查詢兩個字串中的共用子串 三 遍歷二叉樹,從左到右分別展示,從葉子節點向根節點分別展示 用遞迴方法實現中序遍歷 四 n皇后問題 五 都了解什麼深層神經網路,分別運用在...

2017暑期實習面試總結 機器學習演算法崗

雖然心裡念叨該早點準備3月開始的這波面試,但由於生病等種種原因,又或者可以說我是乙個輕微拖延症患者吧,直到3月初被內推了阿里才真正開始準備。截止目前,還算幸運,拿到了幾個offer。就先行做乙個總結吧,算是對這乙個半月的小記了。阿里 螞蟻金服風控部門,機器學習演算法崗。3.2 一面,杭州螞蟻金服,1...