(1)自我介紹
(2)分類和回歸的區別?
1.從**的角度分析,回歸模型輸出是連續性、線性輸出,可以用一條直線較好的擬合,分類的輸出是離散化的。分類模型是將回歸模型的輸出離散化。
2.從訓練的角度來看,分類模型和回歸模型的目標函式不同,分類常見的是log loss,hinge loss,而回歸是square loss。
首先解釋一下回歸問題,分類問題的不同點。回歸問題**的結果是連續的值,而分類問題的**結果是離散的。拿支援向量機舉個例子,分類問題和回歸問題都要根據訓練樣本找到乙個實值函式g(x). 回歸問題的要求是:給定乙個新的模式,根據訓練集推斷它所對應的輸出y(實數)是多少。也就是使用y=g(x)來推斷任一輸入x所對應的輸出值。分類問題是:給定乙個新的模式,根據訓練集推斷它所對應的類別(如:+1,-1)。也就是使用y=sign(g(x))來推斷任一輸入x所對應的類別。綜上,回歸問題和分類問題的本質一樣,不同僅在於他們的輸出的取值範圍不同。分類問題中,輸出只允許取兩個值;而在回歸問題中,輸出可取任意實數。
注意:分類模型和回歸模型的本質是一樣的,分類本質上是乙個線性模型,因為除去sign()、sigmoid()對映函式關係,其他步驟、演算法都是線性回歸的。可以說,分類都是以線性回歸為理論支撐的。回歸模型,無法做到sigmoid()的非線性形式,sigmoid()可以輕鬆處理0/1分類問題。分類問題其實僅在回歸的基礎上,套用了乙個邏輯函式,但也就是由於這個邏輯函式,邏輯回歸成為機器學習領域一顆耀眼的明星,更是計算廣告學的核心。
refercnce:
(3)模型訓練的方法有哪些麼?
最小二乘法、最大似然估計
(3)你最熟悉的分類演算法有?
邏輯回歸、支援向量機、神經網路、決策樹、adaboost
(4)那你簡單說一下adaboost演算法?
(5)在adaboost演算法中,你提到了整合學習,那你能簡單說一下整合學習麼?
(6)整合學習中,你提到了隨機森林,那你能簡單介紹一下隨機森林麼?
(7)如何解決過擬合現象?先解釋一下過擬合吧!如何解決?
(7)決策樹是怎麼進行**的?
我的回答剪枝。
能說的更具體一些麼?
你了解決策樹的id3、c4.5、cart演算法麼?
(8)你一直在說支援向量機,那你能說一下核函式的作用嗎?
(9)你了解的聚類演算法有哪些?
k-means演算法
(10)還有其他的聚類演算法麼?
比如說:層次聚類、密度聚類、神經網路聚類、統計學聚類等
(11)詳細介紹一下k-means演算法的原理?
(12)k-means是如何調整中心的?
(13)噪點對k-means的影響大麼?
(14)簡答說一下神經網路
大概就這些,想起來在補吧!
先把問題記錄一下,一道一道慢慢解決吧!
2017暑期實習面試總結 機器學習演算法崗
雖然心裡念叨該早點準備3月開始的這波面試,但由於生病等種種原因,又或者可以說我是乙個輕微拖延症患者吧,直到3月初被內推了阿里才真正開始準備。截止目前,還算幸運,拿到了幾個offer。就先行做乙個總結吧,算是對這乙個半月的小記了。阿里 螞蟻金服風控部門,機器學習演算法崗。3.2 一面,杭州螞蟻金服,1...
BAT面試經驗分享(機器學習演算法崗)
阿里 對於大資料方面的問題可參考 二面 相隔時間有三周左右,本來以為沒戲了 二面是個大叔,問了專案中的fm和ffm的區別 參考問的主要是專案上的,問了天池大資料比賽的一些問題,因為說了平時會關注最新技術動態,因為就叫我舉個例子,剛好看過微軟識花的那篇文章就好好講了下。最後問了下工作地啥的。二面就40...
5 16 微軟 機器學習崗
一 單詞反轉 將字串單詞反轉輸出,例如 str how are you output you are how 二 s1和s2兩個字串,查詢兩個字串中的共用子串 三 遍歷二叉樹,從左到右分別展示,從葉子節點向根節點分別展示 用遞迴方法實現中序遍歷 四 n皇后問題 五 都了解什麼深層神經網路,分別運用在...