乙個kaggle題目
一、資料集
2220895個使用者 + 6095 item 73209277個訓練樣本,34910937個測試樣本
a) 訓練集 rec_log_train.txt : userid-itemid-result(1or-1)-timestamp 四列特徵。
b) 測試集,同上
1 user_profile.txt id-註冊時間-性別-已發微博數量-使用者標籤(each unique tag is encoded as an unique integer)這裡的標籤是指特徵化的使用者畫像,具體到某人的喜歡的東西,比如 爬山 或者游泳。
4 使用者sns user_sns.txt: 粉絲id-關注id
二 **
乙個完整推薦系統的設計實現
在學術界,一般說到推薦引擎,我們都是圍繞著某一種單獨的演算法的效果優化進行的,例如按內容推薦,協同過濾 包括item based,user based,svd分解等 上下文推薦,constraint based推薦,圖關係挖掘等。很多比較牛的單個演算法,就能在某個指標上取得較好效果,例如mae,rm...
採用KNN演算法實現乙個簡單的推薦系統
1.基於相似使用者的knn 選用公式如下 2.基於相似物品的knn 要求 1.純python 實現 2.利用sklearn開發包實驗 實驗要求 1.資料集 movielens1m,movielens100k 2.評價指標 rmse,均方根誤差 root mean squared error,rmse...
推薦乙個作業系統的lab
我推薦的這個lab,名字叫做ucore,這個lab來自清華大學的作業系統課程,首先要說明一下,這確實是非常好的乙個lab,想入門linux核心的同學可以讀一讀這個lab所涉及的ucore的原始碼。其實只要大家認認真真做下去,收穫肯定會非常的大。雖然這麼說,但是,這個lab對大家的基礎要求稍微有一點高...