此資料集是將一些其他的資料集聯絡起來之後得到的乙個資料集。
其他的資料集分為兩類,分別是推薦系統的資料集和知識庫。推薦系統的資料集(rs data sets),包括movielens, lfm-1b和amazon book三種;知識庫的資料集( kb data sets),包括freebase和yago。
將來自推薦系統的三個資料集分別與來自知識庫的兩個資料集相聯絡,形成六個聯絡結果。
將以上資料集聯絡起來的主要思想是:根據rs data sets的專案標題與kb data sets相連線。(類似於資料庫中的自然連線)
但最終在kb4rec v1.0資料集中只提供了由推薦系統的資料集連線到freebase的三個資料檔案:ml2fb.txt、lfb2fb.txt、ab2fb.txt。
由於推薦系統的三個資料集movielens, lfm-1b和amazon book分別包含了電影、**、圖書三大類,以及知識庫的兩個資料集freebase和yago中包含大量的專案資訊,所以kb4rec包含豐富的知識庫(kb)資訊,可以為推薦系統提供豐富和結構化的知識庫(kb)資訊,使訓練出的推薦模型具有更好的推薦效果。
在原**(原**位址)中,資料集的建立者對資料集kb4rec進行了一系列的實驗驗證,如在kb4rec的基礎上比較不同的推薦演算法,結果表明,kb4rec是可行且有價值的。
另,筆者在畢業**中採用了上文中提到的movielens資料集,在**的總結與展望章節中,分析了採用的資料集具有一定的片面性。而kb4rec資料集正好可以解決這個問題。
資料集的建立者將kb4rec發布在了github上(資料集位址),可在github中通過相應的**呼叫資料集:
@articlejian dou and
jin huang and
siqi ouyang and
jirong wen}
, title =
, journal =
, volume =
, number =
, pages =
, year =
, doi =
, url =,}
@inproceedingsjian dou and
jirong wen and
edward y. chang}
, title =
booktitle =
conference on research
development in information retrieval,
2018
, ann arbor, mi,
usa, july 08-12
,2018
} pages =
year =
, url =
, doi =,}
@inproceedingsjian dou and
yuanpei zhao and
daxiang dong and
jirong wen}
, title =
, booktitle =
2019
, macau, china, april 14-17
,2019
, proceedings,
part },
pages =
, year =
, crossref =
, url =
, doi =
,}
關於對指標理解
在c語言中,記憶體單元的位址稱為指標,打個比喻。代表 0x2000位址代表門牌號,取位址符。i pointer 指標變數,它的內容是位址量 i pointer 指標的目標變數,它的內容是資料 i pointer 指標變數占用記憶體的位址 i pointer 內容位址量 i 取i位址 i pointe...
關於資料對拍
資料對拍是一種通過找到錯誤輸出資料尋找bug的方法 首先,我們可以跟據題意通過bfs,暴力等方法寫出乙份正確的 然後寫個隨機生成資料和驗證輸入輸出的 我們可以拿一道題來熟悉這個流程 路徑規劃 route 題意很好理解,就是給出起點,和終點,求出起點到終點的所需的步數,其中上下左右,斜著走八個方向都算...
對Promise的研究4
promise.reject reason 方法也會返回乙個新的 promise 例項,該例項的狀態為rejected。const p promise.reject 出錯了 等同於 const p new promise resolve,reject reject 出錯了 p.then null,f...