---恢復內容開始---
第二章 提供推薦cf
協同型過濾:允許人們根據自己對文件的感興趣程度新增標註,並利用這一資訊為他人進行文件過濾。
蒐集偏好:在python中建立乙個巢狀的字典
尋找相近的使用者:計算不同使用者間的相似度評價值
方法1:歐幾里得距離評價
以經過人們一致評價的物品作為座標軸,然後將參與評價的人繪製到圖上,並考察他們之間在m維空間中兩個點之間的真實距離遠近。偏好越相似,距離越遠。
判斷兩組資料與某一直線擬合程度的度量。(比歐幾里得距離複雜,但是在資料不是很規範(normalized)的時候,可以得到更準確的結果)
利用python的列表推導式,將自身和其他每一位使用者進行比較,返回排序結果中的前n項
推薦物品
通過乙個經過加權的評價值為影片打分,評分者的結果形成排名。
---恢復內容結束---
集體智慧型程式設計 讀書筆記 一
這本書豆瓣上得分很高,可以當作機器學習,資料探勘在當前web應用的入門書,我也是乙個門外漢加初學者,正在讀這本書 第二章 1.相似度,偏好 首先看例子,現在有乙個資料集 書中給出的 記錄每個人對不同電影的打分,如下所示 critics gene seymour michael phillips cl...
集體智慧型程式設計第7章 讀書筆記
最近在讀 集體智慧型程式設計 這本書,作了一些筆記,好讓自己印象深刻點,不過沒有記錄太多的細節和 第7章主要涉及決策樹分類器。相比於貝葉斯分類器 神經網路分類,決策樹分類器的好處在於模型具有易於理 解的特點,可以將結果轉換成一系列簡單的if else語句。乙個二維表中,行表示使用者,列表示使用者的屬...
《集體智慧型程式設計》讀書筆記 1 聚類簡介
1 聚類演算法的目的是採集資料,然後從中找出不同的群組。2 universal feed parser 3 皮爾遜相關度其實判斷的是兩組資料與某條直線的擬合程度,當兩者完全匹配時,計算結果為1.0,當兩者毫無關係時,計算結果為0.0.4 分級聚類 分級聚類的結果會產生一棵樹 分級聚類雖然會返回一棵形...