問題1:過擬合與欠擬合(定義、產生的原因、解決的方法各是什麼)。
問題2:l1正則與l2正則(有哪些常見的正則化方法?作用各是什麼?區別是什麼?為什麼加正則化項能防止模型過擬合)。
間題3:模型方差和偏差(能解釋一下機器學習中的方差和偏差嗎?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?舉例說明一下)。
問題4:奧卡姆剃刀(說一說機器學習中的奧卡剪梯刀原理)。
問題5:模型評估指標(回歸模型和分類模型各有哪些常見的評估指標?各白的含義是什麼?解釋一下auc?你在平時的實踐過程中用到過哪些評估捐標?為什要選擇這些指標)。
問題6:風險函式(說一下經驗風險和結構風險的含義和異同點)。
問題7:優化演算法(機器學習中常見的優化演算法有哪些?梯度下降法和牛頓法的原理推導)。
問題8:啟用函放(神經網路模型中常用的啟用函式有哪些?說一下各自的特點)。
問題9:核函式(核函式的定義和作用是什麼?常用的核函式有哪些?你用過些核函式?說一下高斯核函式中的引數作用)。
問題10:梯度消失與梯度**(解釋一下梯度消失與梯度**問題,各自有什麼解決方案)。
問題11:有監督學習和無監督學習(說一下有監督學習和無監督學習的特點,舉例說明一下)。
問題12:生成模型與判別模型(你知道生成模型和判別模型嗎?各自的將點是什麼?哪些模型是生成模型,哪些模型是判別模型)。
問題13:線性回歸(線性回歸模型的原理、損失函式、正則化項)。
問題14:knn模型(knn模型的原理、三要素、優化方案以及模望的優缺點)。
問題15:樸素貝葉斯(樸素貝葉斯模型的原理推導,拉普拉斯平滑,後驗概率最大化的含義以及模型的優/缺點)。
問題16:決策樹(決策樹模型的原理、特徵評價指標、剪枝過程和原理、幾種常見的決策樹模型、各自的優/缺點)。
問題17:隨機森林模型(rf模型的基本原理,rf模型的兩個「隨機」。從偏差和方差角度說一下rf模型的優缺點,以及rf模型和梯度提公升樹模型的區別)。
問題18:adaboost(adaboost模型的原理推導、從偏差和方差角度說一下adaboost、adaboost模型的優點)。
問題19:梯度提公升樹模型(gbdt模型的原理推導、使用gbdt模型進行特徵組合的過程、gbdt模型的優缺點)。
問題20:xgboost(xgboost模型的基本原理、xgboost模型和gbdt模型的異同點、xgboost模型的優缺點)。
問題21:logistic回歸模型(lr模型的原理、本質,lr模型的損失函式,能否使用均方損失、為什麼)。
問題22:支援向量機模型(svm模型的原理,什麼是「支援向量」?為什麼使用拉格朗日對偶性?說一下kkt條件、軟間隔svm和硬間隔svm的異同點。svm怎樣實現非線性分類?svm常用的核函式有哪些?svm模型的優缺點各是什麼)
問題23:k-means類(k-means聚類的過程和原理是什麼?優化方案有哪各自優缺點是什麼)。
問題24:層次聚類(層次聚類的過程、原理和優缺點)。
間題25:密度聚類(密度聚類的基本原理和優缺點)。
問題26:譜聚類(譜聚類的基本原理和優缺點)。
問題27:高斯混合聚類(高斯混合滾類的原理和優缺點)。
問題28:em演算法(em演算法的導過程和應用場景)。
問題29:特徵分解與奇異值分解(特徵分解與奇外值分解的原理、異同點、應用場景)。
問題30:主成分分析(pca模型的原理、過程、應用場景)。
問題31:線性判別分析(lda模型的原理、過程、應用場景)。
問題32:區域性線性嵌入(lle模型的原理、過程、應用場景)。
問題33:詞向量(word2vec模型和doc2vec模型的類別,各自原理推導、應用和引數調節)。
問題34:深度神經網路(深度神經網終模型的原理,反向傳播的推導過程,常用的啟用函式,梯度消失與梯度**問題怎麼解決?說一下深度神經網路中的dropout、早停、正則化)。
問題35:lr模型與svm模型的異同點。
問題36:lr模型與樸素貝葉斯模型的異同點。
問題37:k近鄰模型與 k-means模型的異同點。
問題38:id3決策樹、c4.5決策樹、cart決策樹的異同點。
問題39:pca模型與lda模型的異同點。
問題40:bagging模型與 boosting模型的異同點。
問題41:gbdt模型與 xgboost模型的異同點。
問題42:word2vec模型中cwob模式與skip模式的異同點。
問題43:word2vec模型和 doc2vec模型的異同點。
問題44:模型調參(隨便選乙個上述涉及的模型,說一下它的調參方式與過程)。
問題45:特徵組合(常見的特徵組合方式有哪些?各自特點是什麼)。
問題46:特徵工程(結合實踐解釋一下你所理解的特徵工程)。
問題47:缺失值問題(說一下你遇到的缺失值處理問題,你理方式?你使用過哪些,效果怎樣)。
問題48:樣本不平衡問題(你知道樣本不平衡問題嗎?你是怎樣處理的?效果怎麼樣?除上取樣和下取樣外,你還能自己設計什麼比較新穎的方式嗎?)。
問題49:特徵篩選(特徵師選有哪幾種常見的方式?結合自己的實踐經驗說下各自的原理和特點。)
問題50:模型選擇(你一般怎樣挑選合適的模?有實際的例子嗎?)。
問題51:模型組合(你知道哪些模型組合方式?除了運用 adaboost和r,你白己有使用過 bagging和 embedding方式組合模型嗎?結合實際例子說明一下)。
問題52:a/b測試(了解ab測試嗎?為什麼要使用a/b測試)。
問題53:降維(為什麼要使用降維?你知道哪些降維方法?你用過哪些降維方式?結合實際使用說明一下)。
問題55:踩過的坑(你在使川機器學習模型中踩過哪些坑?最後你是如何解決的)。
問題56:機器學習求職要準備哪些項?各項對應如何準備?
間題58:機器學習崗位求職的投遞方式有哪些?什麼時間投遞最合適?投遞目標應該怎樣選擇?
問題59:機器學習崗位求職的簡歷最好與哪些內容?所做的專案應該如何描述?
問題60:面試過程中自我介紹如何說比較合適?求職心態應該如何擺正?如果遇到壓力該如何面對?面試過程中如何掌握主導權?怎樣回答面試官最後的「你還有什麼要間我的」問題?怎樣面對最後的人力資源面試?
求職面試 基礎 基礎問題彙總
取模 5 mod 2 1 5 mod 2 5 2floor 5 2 5 2 3 1 當除數與被除數的符號相同時,rem和mod的結果是完全相同的 當除數與被除數的符號不相同時,結果不同。具體說,rem結果的符號與被除數相同 mod結果的符號與除數相同。1.求 整數商 c a b 2.計算模或者餘數 ...
機器學習問題彙總
1 什麼是分類問題,什麼是回歸問題?區別在 有沒有聯絡?回歸問題 是對輸入資料求乙個逼近真實結果的機率,比如 高考結果能上清華北大的機率。2 線性回歸,邏輯斯蒂回歸,擬合函式,損失函式,梯度下降,學習率,正則化,sigmoid函式之間的聯絡?參考 梯度下降法解線性回歸 梯度下降法解邏輯斯蒂回歸 er...
機器學習崗位面試問題彙總 之 深度學習
自己結合網路內容總結,歡迎指正歡迎補充。最新更新 20170624 版本2 增加22 28 1.模式識別 機器學習 深度學習的區別與聯絡 模式識別 過去 程式 機器做智慧型的事 決策樹等 機器學習 熱點領域 給資料 學習資料 深度學習 前言領域 強調模型 2.早年神經網路被淘汰的原因 耗時 區域性最...