基於內容的資訊推薦方法的理論依據主要來自於資訊檢索和資訊過濾
啟發式的方法就是使用者憑藉經驗來定義相關的計算公式,然後再根據公式的計算結果和實際的結果進行驗證,然後再不斷的是修改公式以達到最終目的。而對於模型的方法就是根據以往的資料作為資料集,然後根據這個資料集來學習出乙個模型。一般的推薦系統中運用到的啟發式的方法就是使用tf-idf的方法來計算,跟還有tf-idf的方法計算出這個文件中出現權重比較高的關鍵字作為描述使用者特徵,並使用這些關鍵字作為描述使用者特徵的向量;然後再根據被推薦項的中的權重高的關鍵字來作為推薦項的屬性特徵,然後再將這個兩個向量最相近的(與使用者特徵的向量計算得分最高)的項推薦給使用者。在計算使用者特徵向量和被推薦項的特徵向量的相似性時,一般使用的是cosine方法,計算兩個向量之間夾角的cosine值。
基於內容的推薦方法用到知識很多都是資訊檢索用的方法,例如tf-idf和文字分類技術等,基於內容的推薦方法其實質就是根據使用者的訪問記錄來得出使用者的特徵屬性,然後再根據使用者的特徵屬性與推薦項的特徵屬性來計算效用函式的值,並將結果推薦給使用者。
基於內容的電影推薦 使用者畫像
使用者畫像構建步驟 使用者畫像建立import pandas as pd import numpy as np from gensim.models import tfidfmodel from functools import reduce import collections from ppri...
推薦系統基礎演算法之基於內容的推薦演算法
基於內容的推薦方法的優點是 基於內容的推薦方法的缺點是 1.特徵 內容 提取,提取每個待推薦物品的特徵 內容屬性 例如電影 書籍 商品的分類標籤等。這些特徵往往分為兩種 結構化的特徵和非結構化的特徵。所謂結構化特徵就是特徵的取值限定在某個區間範圍內,並且可以按照定長的格式來表示。例如,電影類別特徵,...
基於KNN的相關內容推薦
書籍 書名 作者 出版時間 出版社 分類 標籤 名 歌手 發行時間 發行方 風格流派 標籤 電影電影名稱 導演 演員 上映時間 製片方 型別 標籤 豆瓣很多地方都使用了 標籤 這個詞,用貼標籤的形式來完成內容的分類和標識,但其實標籤又分為很多種,有些標籤是在內容生成時就被貼上的,有些可能是後續使用者...