資料結構在搜尋引擎框架中扮演著非常重要的角色。seo顧問
——瀟湘馭文
為您簡單介紹倒排索引
與正向索引
。對沒有程式設計和運算元據庫經驗的站長和seo為簡單起見,我們假設有網頁1和網頁2:
網頁1中僅包含一句話:廈門seo
顧問瀟湘馭文為您提供廈門seo培訓
服務。網頁2中也僅包含一句話:seo是一門藝術。
經過搜尋引擎初步分詞之後,網頁1和2的正向索引如下圖所示:
正向索引
應運而生。
倒排索引
從上圖可以一目了然,倒排索引可以直接參與排名。
比如你搜尋「seo」,搜尋引擎可以快速檢索出包含「seo」搜尋詞的網頁1和網頁2,為後續的相關度和權重計算奠定基礎,從而大大加快了返回搜尋結果的速度。
正排索引與倒排索引
什麼是正排索引 forward index 由key查詢實體的過程,是正排索引.什麼是倒排索引 inverted index 由item查詢key的過程,是倒排索引。倒排索引可以理解為map item,list id 能夠由查詢詞快速 時間複雜度o 1 找到包含這個查詢詞的檔案的資料結構。舉例 文件...
倒排索引是什麼
倒排索引 英語 inverted index 也常被稱為反向索引 置入檔案或反向檔案,是一種索引方法,被用來儲存在全文搜尋下某個單詞在乙個文件或者一組文件中的儲存位置的對映。它是文件檢索系統中最常用的資料結構。正排索引 正排索引是以文件的id為關鍵字,索引記錄文件中每個字的位置資訊,查詢時索引中每個...
關於正向索引與反向索引
這一節我們來看看搜尋引擎中最重要的幾個資料結構。前面我們說過索引包含正向索引和反向索引兩部分,首先我們看看正向索引的結構。正向索引用來儲存文件的各種屬性,從邏輯上講,正向索引其實就是乙個大陣列,陣列中每個元素就是乙個文件的屬性集合。如果正向索引是有schema的,那麼它其實就類似乙個關係表或者說二維...