google 的相關提示功能
中科院軟體所張俊林
2023年3月
google有計算使用者相似需求的演算法,並且依據這個演算法來對使用者進行相關提示.基本步驟如下:
(1)得到使用者查詢log檔案作為輸入,其中包含大量不同使用者提交給搜尋引擎的查詢;
(2)首先將使用者查詢進行分類,假設log檔案由以下三個域構成
query userid timestamp
query:使用者提交的查詢
userid:使用者id資訊
tmestamp:使用者提交查詢的時間資訊
(3)對於使用者查詢進行排序,排序原則是首先按照使用者id進行排序,對於同一使用者,將查詢按照時間進行排序;
(4)在排好序列的log裡面尋找滿足下列特徵的集合:a.如果兩個查詢屬於同一使用者發出,b.而且兩個查詢在排序的log檔案裡面緊密相鄰,c.同時兩個查詢有部分詞彙相同;
(5)此時,可以將兩個查詢中不同的詞彙看作可能的候選同義詞,這些同義詞用不同詞彙表達相似的資訊需求;
(6)統計這兩個候選同義詞在語料庫檔案裡面共現次數,如果出現次數足夠大,則認為是屬於表達相似使用者需求的同義詞,否則認為不是同義詞;具體計算應該採用的是互資訊的方法,也就是說首先計算兩個候選同義詞同時在語料庫裡面出現次數,然後計算每個候選詞彙單獨出現在語料庫裡面面的次數,然後計算互資訊來確定;
(7)將統計得出的同義詞作為使用者查詢相關資訊提示的依據;
Google怎麼做 1 相關提示
google 的相關提示功能 中科院軟體所 張俊林 2006年3月 下面說說 的相關提示如何實現的 你使用兩個搜尋引擎並觀察一下兩個系統的相關提示就會發現 google 比如輸入查詢 劉翔 google 的相關提示 足球 羅雪絹 姚明 田徑 等等 劉翔 劉翔簡介 等等 最大的區別是 而google ...
google怎麼做 2 相似網頁演算法
google 的相似網頁功能演算法 中科院軟體所 張俊林 time stamp 2006年4月3日 我們使用 google 在檢索結果列表裡面每個檢索結果會有 相似網頁 similar pages 的鏈結,主要提供和所列出的頁面相似的網頁 那麼這個功能是如何實現的 利用鏈結分析來提供相關網頁的功能 ...
google怎麼做 2 相似網頁演算法
我們使用 google 在檢索結果列表裡面每個檢索結果會有 相似網頁 similar pages 的鏈結,主要提供和所列出的頁面相似的網頁 那麼這個功能是如何實現的 google 其基本思路是 如果乙個頁面和另外乙個頁面相似 那麼其鏈結關係也是相似的 其演算法如下 1 使用者選定某個頁面 a,希望檢...