據知情人透露,
gmm,和em演算法(推導q函式及證明收斂性)。
k-means與gmm的對應關係。k-means是無監督的聚類方法,gmm是有監督的生成模型。
svm的公式推導。
神經網路bp演算法的公式推導。
logistics regression的推導,l1和l2正則化。l1有套索現象,l1的weights比較稀疏,適用於快速計算**模型。
plsa和lda有關nlp的問題。
目標方程優化問題,梯度下降,隨機梯度下降,牛頓法,擬牛頓法。l-bfgs演算法大概。
google的word2vec。
hashtable的實現。
先扒到這。
有關網路程式設計的一些面試
1,首先說明socket是什麼?我們知道 資訊的互動需要涉及到tcp的四層模型 socket 可以看作使用者程序和核心網路協議棧程式設計 互動 介面 socket 不僅可以在同一臺主機上進行通訊,也可以在網路上不同的主機間進行通訊,也可以異構 軟硬體平台不同 進行通訊 手機qq和pc機上的qq進行通...
python的一些推薦
看到未名的幾篇帖子 使我想起了和python的一些經歷,於是寫了一篇咚咚。1 書籍 python的syntax足夠簡單,semantics也不複雜,不怎麼會使人混亂,一般來說看自帶的文件足夠可以學習了,看完兩章便可以寫出一些non trivial的程式了。硬要說入門書籍。learning in py...
Xgboost的一些坑
這兩天做乙個競賽,用xgboost作為工具來做了一些事情。主要的框架是 xgboost的python擴充套件。然後這過程中花了不少時間在解決各種xgboost的error上。大部分的問題都在這個函式裡 dtrain xgb.dmatrix train.txt dtest xgb.dmatrix te...