fm:解決稀疏資料下的特徵組合問題 factorization machine(因子分解機)
美團技術團隊的文章,覺得寫得很好啊:
複雜度變成(kn)
ffm是(knn),fmm是隱變數和fileld相關
假設樣本的 n個特徵屬於 f個field,那麼ffm的二次項有 nf個隱向量。而在fm模型中,每一維特徵的隱向量只有乙個。fm可以看作ffm的特例,是把所有特徵都歸屬到乙個field時的ffm模型。根據ffm的field敏感特性,可以匯出其模型方程。
推薦系統的常用演算法原理和實現
推薦系統的任務就是解決,當使用者無法準確描述自己的需求時,搜尋引擎的篩選效果不佳的問題。聯絡使用者和資訊,一方面幫助使用者發現對自己有價值的資訊,另一方面讓資訊能夠展現在對他感興趣的人群中,從而實現資訊提供商與使用者的雙贏。基於人口統計學的推薦 系統首先會根據使用者的屬性建模,比如使用者的年齡,性別...
推薦系統實踐 好的推薦系統
一 好的推薦系統 1.什麼是推薦系統 從某種意義上說,推薦系統和搜尋引擎對於用語來說是兩個互補的工具。搜尋引擎滿足了使用者有明確目的時的主動查詢需求,而推薦系統能夠在使用者沒有明確目的的時候幫助他們發現感興趣的內容。分為社會化推薦,基於內容的推薦和基於協同過濾的推薦。目前廣告投放的技術主要分三種 上...
決策樹的原理推導
決策樹可以作為分類演算法,也可以作為回歸演算法,同時特別適合整合學習比如隨機森林。1970年昆蘭找到了用資訊理論中的熵來度量決策樹的決策選擇過程,昆蘭把這個演算法叫做id3。熵度量了事物的不確定性,越不確定的事物,熵就越大。隨機變數x的熵的表示式如下 其中n代表x的n種不同的離散取值。而pi 代表了...