推薦系統的重點 難點問題

2021-07-11 19:54:17 字數 823 閱讀 4176

1)特徵提取問題

2)模型過擬合問題(可擴充套件性問題)

推薦系統中推薦演算法無法完全掌握使用者每個方面的興趣和需求,因為使用者之前沒有對足夠多類別的物件進行評價。過擬合現象是指系統推薦給使用者的物件與使用者剛剛看過的不是太相似,就是太不相關。模型過擬合(過學習)的問題本質上來自於資料的不完備性,這在實際應用中是無法完全避免的。在資訊檢索領域這類問題廣泛存在,解決的主要方法是引入隨機性,使演算法收斂到全域性最優或者逼近全域性最優。隨機方法包括遺傳演算法[51]等。daily learner相關的文獻[15,39]針對這個問題考察了被推薦的物件的相關性(relevant)和冗餘性(redundancy),認為被推薦的物件首先不能與使用者看過的物件重複(冗餘),其次必須有相關性以相互聯絡.推薦的多樣性是必不可缺的。

3)新使用者問題

系統沒有儲存或者儲存很少新使用者的資訊,包括檢視物件的歷史記錄和新使用者對物件的評分,基於模型的方法無法獲得訓練資料而基於規則的方法難以進行推理。近期一些研究特別針對這個問題提出了解決方法。文獻[52,53]利用物件熵(entropy)、受歡迎程度(popularity)、使用者個性屬性等來改進效果。

4)新物件問題

5)稀疏問題

在任何大型的推薦系統中,對於乙個使用者,總有大量的物件沒有經過使用者的評價或者檢視,而且這類資料常常比已經有此使用者評價的資料量更大[7]。使用者之間由於選擇的差異性非常大造成稀疏情況,即任意兩個使用者的評分差別都非常大。文獻[38]提出初步的解決方法,將使用者的年齡、國籍、性別等個人資訊增加作為使用者相似度計算的根據,稱為基於人口統計學的過濾方法(demographic filtering)。文獻[26,54]使用主分量分析(svd)降維方法嘗試把稀疏的關係矩陣降維到低維,以得到使用者之間潛在的關係。

CEGUI重點難點集

感覺cegui確實不想很多商業成熟的sdk,有些地方的表現不盡如人意,但是畢竟是個開源專案,使得我們能根據自己需求定製自己的功能。但在定製需求之前,我們需要對cegui進行乙個比較詳細的了解才能夠得心應手的定製需求。下面就將學習cegui過程中遇到的重點難點羅列起來,方便自己和一起學習。affect...

Linux 裝置驅動的重點 難點

編寫 linux 裝置驅動要求工程師有非常好的硬體基礎,懂得 sram flash sdram 磁碟的讀寫方式,uart i2c usb 等裝置的介面以及輪詢 中斷 dma 的原理,pci 匯流排的工作方式以及 cpu 的記憶體管理單元 mmu 等。編寫 linux 裝置驅動要求工程師有非常好的 c...

前端秋招之騰訊重點難點

1 下面關於ie ff下面指令碼的區別描述錯誤的是?a b d a.innertext ie支援,firefox不支援 b.document.createelement firefox支援,ie不支援 c.setattribute class styleclass firefox支援,ie不支援 d...