下面就針對各個階段描述下大概的過程。
關鍵字商品
耐克001
nike
001阿迪達斯
002三葉草
002adidas
002這樣在搜尋的時候可以直接基於關鍵字定位到商品。這種方式針對於最基本的資料庫就可以實現。
隨著應用的完善,直接基於關鍵字的匹配難以維護。因為商品逐漸增多,使用者搜尋的關鍵字變化也越開越大,單靠業務規則來定義關鍵字和商品的關係就太麻煩了,因此就引入了全文檢索的系統。
關於全文檢索的技術,說的通俗一點,就是維護了關鍵字跟相關「文件」的關係。舉個典型的例子——詞典,我們想要在詞典中快速查乙個英文漢字最簡單的方式,就是通過目錄進行定位,然後懂啊指定的頁碼去查詢對應的字;而不是一頁一頁的遍歷尋找。
比如,在商品的列表中,商品的主標題有下面的內容:
然後針對上面的文件進行分詞建立倒排索引,就形成了:
關鍵字文件位置
耐克001doc,2,3 002doc,4,5
阿迪達斯
003doc,6,7 004doc,1,3
這樣搜尋耐克
的時候,就可以直接基於後面的文件位置定位到目標的內容。
從另一方面來說,商品主要的搜尋內容**就是主標題和副標題。大家有興趣的可以參考**京東,看一下它們的商品標題的定義規則。當然商品的標題也是需要經過統一的設定培訓的,不能賣乙個牙膏,結果起的名字是乙個身穿阿瑪尼手握iphone x,帶著阿瑪尼開著瑪莎拉蒂的b血型雙子座青春美少男早晨專用的牙膏
——這不是扯淡麼!
這就涉及到排名的優化了,不同的商家信譽、客服的態度是不一樣的,商品的質、銷量也是不一樣的。因此就可以根據商品相關的屬性以及商家相關的屬性進行排序。
商品的屬性,有銷售額、下單量、退貨率、轉化率、折扣、**、上線的日期、適合的季節、pv、瀏覽的停留時間、庫存等等
根據這些屬性,就可以針對搜尋匹配的商品進行排序了。
當應用趨於穩定、使用者增長到一定層度時,就開始注重使用者的體驗了。比如乙個男性使用者搜尋鞋子和女性搜尋鞋子,我們期望看到的效果是不一樣的,這其實就是個性化搜尋。
具體大廠們的做法我們時不得而知的,知道也不敢亂說,因此只能通過網上公開的一些資訊,來揣測琢磨一下,如果我們自己想要做,該怎麼實現。
那麼我這裡有兩種思路:
基於使用者模型新增關鍵字
這樣使用者在看到推薦出來的熱詞時,就可以直接點選下方的搜尋搭配詞,進行精細化的搜尋,
另方面,也可以預設在後台加上這個使用者的一些屬性,優先進行推薦搜尋。這種方式實現起來也不難,比如借助elasticsearch, 如果搜尋的是鞋子
,那麼關鍵字傳輸到後台時,可以直接查詢一下使用者模型,新增性別 ——鞋子 女
進行搜尋。如果使用者搜尋的男鞋子
,經過分詞後,一樣可以轉換成鞋子 男
,此時就不需要再去查詢使用者模型獲得性別屬性了。類似的,我們還可以增加喜歡的風格、購買力等屬性。
不過這種方式是在商品搜尋結果很多的時候推薦使用。
基於使用者畫像和物品畫像進行商品匹配
另一種方式沒有具體想好,大概的思路就是構建使用者畫像和物品畫像。需要注意下面的問題:
大致的流程是,獲取使用者特徵、獲取搜尋匹配的200個商品以及它們的特徵;然後就可以基於使用者特徵和物品特徵做相似度計算,比如夾角余弦。這樣做完相似度計算後,取前50個作為搜尋的結果展現即可。
如果又一些深度學習的經驗,也可以嘗試基於深度學習做使用者和物品的word embedding,然後直接計算它們的相似度。這種想法暫時還只是設想,具體如何實現還需要根據世紀的場景來做。
現在知識圖譜很火,如果能建立商品相關的知識圖譜,那麼搜尋又可以更智慧型一些了。比如搜尋angleababy穿過的阿迪鞋子
,就會搜尋出來angleababy在錄製奔跑吧兄弟時,穿過的阿迪達斯的運動鞋。是不是感覺很有意思! 哈哈哈哈哈哈哈
關於個性化搜尋
搜尋的進化 搜尋的核心是獲取資訊,在過去,搜尋的進化一直圍繞著如果更好的獲取資訊,核心是個性化和實時資訊。甚至由於搜尋變得過於個性化,人們獲得的資訊都是自己想看到的,從而讓原本能夠擴大人們視野的搜尋變成了把人們限制在自我的世界工具。這還引發了關於搜尋過分個性化可能引發的弊端的討論。隨著移動網際網路的...
個性化搜尋與SEO
以前在點石論壇裡有乙個帖程式設計客棧子問,中國seo水平與世界水平相vptqobg差多少?我記得我回了個帖子說,大概相差半年到一年。這種差距並不是在優化技術上的差距。比如說網頁上標題標籤寫法,關鍵詞部署,結構的安排等,這些優化技術在近幾年都沒有什麼明顯變化,國內的seo與國際水平也沒有什麼差別。說到...
利用個性化搜尋引擎查詢需要的個性化資訊
很多人現在都是活在網上的,而在網上搜尋資料更是每日必做的功課。我們最常用的搜尋引擎一般是google 這些主流。但是如果你想搜尋某一型別,例如特定的檔案 報告之類就要用到另類的搜尋引擎了,好好利用乙個搜尋引擎,就能令搜尋資料事半功倍。估計不少人搜東西一般首選 google yahoo等這些搜尋引擎,...