lightgbm, xgboost rf和gbdt的異同
(對於id3,c4.5,cart也要了解,對於xgb的演算法原理要充分理解,比如損失函式的推導過程,為什麼要使用二階泰勒展開。最好有一些調參經驗)
svm損失函式推導
樸素貝葉斯公式推導與實現
處理不平衡常用方法
卷積層相比fc層有哪些優勢?
非線性分類演算法有哪些
如何判斷乙個演算法是線性的還是非線性的?
stacking/boosting/bagging的區別
手動實現堆排序
求auc
l1和l2的區別
實現快排
lr的實現,優點,如何並行,特徵有共線性會怎麼樣?
pca和lda
常見啟用函式的優缺點
從方差和偏差的角度比較bagging和boosting
經驗風險、期望風險、結構風險
svm與lr的區別
手寫kmeans
實際場景下做softmax容易出現一些問題,怎麼解決
程序和執行緒的區別
python/c++多執行緒,多程序如何使用
python迭代器,裝飾器
bootstrap抽樣
特徵選擇方法
野指標是什麼意思
64匹馬,八個賽道,找出最快的四匹,最壞情況下最少要比多少次(更常見的是25匹馬,5個賽道找出最快的3匹)。
12個小球,其中有乙個與其他的重量不一樣,給你乙個天平,最壞情況下最少稱多少次可以找出重量不同的小球。
1000杯水中有一瓶是毒藥,小老鼠喝一滴一小時就會死,給你10只小老鼠,在一小時內找出這瓶水 。
p-r曲線和roc曲線的區別
什麼是凸問題?
常見的凸優化方法?
cnn/rnn/lstm的原理
從方差,偏差,雜訊的角度解釋泛化誤差
特徵工程相關。比如如何處理類別特徵?onehot,tfidf會出現什麼問題之類。
詞嵌入embedding相關知識
梯度**/梯度消失
池化層,卷積層的作用
dropout(訓練和測試階段分別如何處理)
mle,map和貝葉斯估計的區別
dnn反向傳播的推導
lr為什麼用交叉熵而不是mse?
為什麼lr權重可以全部初始化為0,nn不行
常見的幾個聚類演算法
判別式模型和生成式模型
計量經濟學重要問題
計量經濟學是數量經濟學的乙個分支,是在經濟理論和統計資料的基礎下,應用數學 統計學和計算機技術,建立計量經濟學模型,分析經濟變數之間的隨機因果關係。計量經濟學是經濟學 統計學和數學的交叉學科。建立計量經濟學模型 估計模型的引數 用統計學方法對模型進行檢驗 用檢驗好的模型去分析現實經濟 模型的檢驗分為...
WordPress 5 0的重要問題,答案已有
我們正處於wordpress非常激動人心的時刻。wordpress 5.0將於11月27日星期二正式發布,這可能是wordpress 15年生命週期中最令人期待的更新。gutenberg專案於2017年1月開始,已經有成千上萬的wordpress社群成員進行了安裝 測試和改進。gutenberg還在...
mysql索引必須了解的幾個重要問題
1 索引是幹什麼的?索引用於快速找出在某個列中有一特定值的行。不使用索引,mysql必須從第一條記錄開始讀完整個表直到找出相關的行。表越大,花費的時間越多。如果表中查詢的列有乙個索引,mysql能快速到達乙個位置搜尋到資料檔案的中間,沒有必要檢視所有資料。大多數mysql的索引 primary ke...