/*
.*/
的相關提示功能
中科院軟體所
張俊林
2006年3月 ,
下面說說
的相關提示如何實現的
,你使用兩個搜尋引擎並觀察一下兩個系統的相關提示就會發現
.比如輸入查詢」劉翔
的相關提示」足球
」/」羅雪絹
」/」姚明
」/」田徑」等等
,:」
劉翔」/」
劉翔簡介」等等
.最大的區別是:,
而google
的相關提示視野要開闊很多.那麼
是如何做的
?
有計算使用者相似需求的演算法
,並且依據這個演算法來對使用者進行相關提示
.基本步驟如下
:
(1)得到使用者查詢
log檔案作為輸入
,其中包含大量不同使用者提交給搜尋引擎的查詢
;
(2)首先將使用者查詢進行分類,假設
log檔案由以下三個域構成
queryuseridtimestamp
query:
使用者提交的查詢
userid:
使用者id資訊
tmestamp:
使用者提交查詢的時間資訊
(3)
對於使用者查詢進行排序
,排序原則是首先按照使用者
id進行排序
,對於同一使用者
,將查詢按照時間進行排序
;
(4)在排好序列的
log裡面尋找滿足下列特徵的集合
:a.如果兩個查詢屬於同一使用者發出
,b.而且兩個查詢在排序的
log檔案裡面緊密相鄰
,c.同時兩個查詢有部分詞彙相同
;
(5)此時
,可以將兩個查詢中不同的詞彙看作可能的候選同義詞
,這些同義詞用不同詞彙表達相似的資訊需求
;
(6)統計這兩個候選同義詞在語料庫檔案裡面共現次數
,如果出現次數足夠大
,則認為是屬於表達相似使用者需求的同義詞
,否則認為不是同義詞
;具體計算應該採用的是互資訊的方法
,也就是說首先計算兩個候選同義詞同時在語料庫裡面出現次數
,然後計算每個候選詞彙單獨出現在語料庫裡面面的次數
,然後計算互資訊來確定
;
(7)將統計得出的同義詞作為使用者查詢相關資訊提示的依據
;
google怎麼做(3 搜尋結果重排序
中科院軟體所 張俊林 timestamp 2006年5月19日 google 在使用者初次檢索結果基礎上又利用連結關係進行了重排序 期望能夠使得排序結果與使用者查詢更加相關 其演算法如下 1 首先根據使用者查詢得到初步檢索結果 從初次檢索結果裡面選擇前列 k個頁面構成重新排序的一個頁面集合 在選擇頁...
Google怎麼做 1 相關提示
google 的相關提示功能 中科院軟體所張俊林 2006年3月 google有計算使用者相似需求的演算法,並且依據這個演算法來對使用者進行相關提示.基本步驟如下 1 得到使用者查詢log檔案作為輸入,其中包含大量不同使用者提交給搜尋引擎的查詢 2 首先將使用者查詢進行分類,假設log檔案由以下三個...
怎麼做產品
和使用者交流是為了做出更好的 產品 打造更好的體驗,但真正好的產品出現之前,使用者也不知道他們想要什麼 比如,在汽車沒出現的馬車時代,使用者會說 我需要一匹更快的馬 那些情緒激動 很生氣的使用者常常能變為最忠實的使用者,只要你能夠打動他們。所以,情緒裡有絕對的價值,如果你能在這些使用者生氣的時候,好...
直播怎麼做?
1 手機 那麼手機直播需要哪些裝置呢,首先是一部畫素高的手機,這個就不具體說明了。其次是光源,也就是補光燈,布光是一門專業的學科,有興趣的同學可以找點資料深入瞭解一下。一般在環境光充足的情況下可以直接選擇那種燈 支架一體的,可自行某寶。3 攝像頭 我們平時所看的才藝主播,帶貨主播,遊戲主播,絕大部分...
seo優化方案怎麼做?seo怎麼做優化?
但要害詞在優化之前應該先進行選擇,這一項作業意義嚴峻。一些短要害詞雖然上手,但越是上手的要害詞流量就越為大公司所把控。中小型企業在優化這些要害詞時會好不容易且難以收到成效。所以關於新 或是一些中小型的企業來說,選擇一些較為簡略優化的要害詞就顯得尤為要害。要害詞優化的難易度可以通過查詢要害詞查詢熱度來...