京東商品推薦系統

2021-06-22 11:02:21 字數 661 閱讀 1697

京東商品推薦系統

個性化推薦是根據使用者的興趣特點和購買行為,向使用者推薦使用者感興趣的資訊和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的資訊和產品過程無疑會使淹沒在資訊過載問題中的消費者不斷流失。為了解決這些問題,京東商品推薦系統應運而生。個性化推薦系統是建立在海量資料探勘基礎上的一種高階商務智慧型平台,以幫助京東為其顧客購物提供完全個性化的決策支援和資訊服務,通過協同過濾演算法,分析使用者行為,為使用者推薦商品。

協同過濾演算法:

1.基於使用者的協同過濾

基於usercf的基本思想:基於使用者對物品的偏好,找到相鄰鄰居使用者

,然後將鄰居使用者喜歡的推薦給當前使用者 

2.基於商品的協同過濾

通過使用者對不同item的評分來評測item之間的相似性,基於

item之間的相似性做出推薦

資料量:基於hadoop架構,支援gb,tb,pb級資料量

演算法檢驗:通過準確率,召回率,覆蓋率,流行度等指標評判

結果解讀:通過itemcf的定義,合理給出結果解釋

技術架構:hadoop mapreduce  mahout 

演算法模型:演算法的思想

1.建立物品的同現矩陣

2.建立使用者對物品的評分矩陣

3.矩陣計算推薦結果

京東的商品爬蟲

那麼先看一下需求 並在基礎上進行簡單的剔除無效資訊的操作,例如我想獲取所有農產品土豆的資訊,但是如果鍵入土豆無疑會獲得類似削皮刀之類的東西 那麼這時候我們就需要將他剔除,感謝京東,對物品的分類資訊做的很細膩,我們可以直接獲取到京東的商品資訊,從而進行判斷 但是例如搜尋豬肉時。是會有許多種類的,此時我...

爬取京東商品

一 進入京東主頁 二 進入商品詳情頁 2 商品名稱 3 商品 from selenium import webdriver 用來驅動瀏覽器的 相當於模擬人的點選事件來連續的訪問瀏覽器 from selenium.webdriver import actionchains 破解滑動驗證碼的時候用的 可...

python京東商品 Python爬取京東商品資料

對京東某一商品資訊頁面的html 進行分析。能夠發現它的圖書產品資訊頁面都含有這樣一段 不同類的商品頁面有些不同 window.pageconfig 顯然這就是我們須要的商品資訊,python 例如以下 import json import re import urllib for i in ran...