hub網頁(hub)
網頁(pic)
內容類別
是從語義上對網頁的內容進行分類
正文是原始網頁中真正描述主題的部分,因此,在某些具體應用中用正文代替原始網頁更為合理。
相關鏈結是指在本網頁中指向與正文內容相關的網頁的鏈結,而非廣告等噪音鏈結。將正文和相關超鏈重新組合就得到了淨化後的網頁。
網頁的表示
構造標籤樹
提取docview模型要素的方法
2: if 該塊中存在重要資訊標籤資訊 then
3: 檢查重要資訊標籤中的內容是否在噪音詞集合中出現
4: if 不在噪音詞集合 then // 為真實重要資訊
5: 將重要資訊標籤的影響因子累加到該內容塊的影響因子上
6: end if
7: if 該內容塊的影響因子大於1 then
8: 提出的權值傳遞策略在標籤樹中傳遞權值
9: end if
10: end if
11:end for
12:計算各個特徵項的權值
搜尋引擎 原理 技術與系統
把今天的看的點知識,挑重要的記下來。搜尋引擎是什麼?搜尋引擎 說到底是乙個計算機應用軟體系統,或者說是乙個網路應用軟體系統。網路搜尋引擎 它根據使用者提交的類自然語言查詢詞或者短語,返回一系列很可能與該查詢相關的網頁資訊,供使用者進一步判斷和選取。全引自 搜尋引擎 原理 技術與系統 呵呵 網路搜尋引...
搜尋引擎技術原理
一 web搜尋引擎技術綜述 二 google技術 四 結束語 搜尋引擎 search engine 是指根據一定的策略 運用特定的電腦程式蒐集網際網路上的資訊,在對資訊進行組織和處理後,為使用者提供檢索服務的系統。一 web搜尋引擎技術綜述 一 引子 隨著網路技術的應用與發展,互連網已經成為資訊的重...
這就是搜尋引擎 讀書筆記一
這就是搜尋引擎 讀書筆記一 相信搜尋引擎對於每乙個愛好演算法甚至愛好技術的it人員都具有強烈的好奇心吧,因為搜尋引擎在網際網路中的地位實在是不可撼動。想象如果網際網路沒有了搜尋引擎,那麼我們平常技術上出現瓶頸了怎麼辦?甚至連普通的生活都離不開搜尋,大學生的你訂餐了嗎?今天,我給大家講解一下搜尋引擎及...