目前介紹的演算法各有利弊:
1.1.1 海量資料推薦
1.1.2 高質量推薦
為了提公升推薦系統的推薦精度以及推薦多樣性,工業上會對推薦系統進行特徵、模型等多層面的融合來構建混合推薦系統。
名稱python**
計算方法
標準化sklearn.preprocessing.scale
x ′=
x−xs
x^=\frac
x′=sx−
x最大最小標準化
sklearn.preprocessing.minmaxscale
x ′=
x−mi
nmax
−min
x^=\frac
x′=max
−min
x−mi
n二次核sklearn.preprocessing.normalize/
有監督離散化:基於熵的離散化方法和基於卡方的離散化方法
方法三:時間特徵處理
方法計算介紹
優缺點皮爾森相關係數
兩個變數之間協方差與標準差的商
衡量的是線性相關性,只對線性關係敏感
距離相關係數
余弦相似度
優點是變數大小不是必須一致的
卡方檢驗
通過觀察實際值與理論值的偏差程度/方法
介紹l1正則
弱特徵的係數會變成0,導致學習到的模型稀疏
l2正則
使得係數的取值變得平均,是乙個更穩定的模型
之前的排序是採用均方根作為優化指標,但是發現:
經典的排序指標
推薦系統讀書筆記
標籤 空格分隔 演算法 基於內容的推薦 基於知識的推薦 混合推薦方法 主要思想 給定乙個評分資料集和當前 活躍 使用者的id作為輸入,找出與當前使用者過去有相似偏好的其它使用者,這些使用者被稱為對等使用者或最近鄰.物品1物品2 物品3物品4 物品5alice53 44?使用者131 233使用者24...
第五周讀書筆記
高效程式的奧秘 讀後感 一 這周開始了 高效程式的奧秘 為什麼選擇這本書作為這次讀書筆記的內容,是因為在上一次的個人作業中,我自己編寫程式的低效,給我留下了深刻的印象,乙個170mb的資料夾下檔案詞數的統計,竟然要花上10分鐘的時間 這還是我調整了資料結構的情況下 在調整之前,甚至程式無法執行完畢,...
《創新者》讀書筆記 第五周讀書筆記
創新者一書,實際上是這連個世界以來資訊科技的編年史,注重介紹了歷史潮流中的創新者,但這不意味著作者宣揚個別天才帶領了技術的進步,相反,作者強調了創新者所處環境對其的影響,在創新中的作用,展現了那些天才創新者的必然。作者想要揭示的是 科技革命不是一兩個天才的成就,而是一群人的努力,創新的起源不是乙個簡...