叮嘟!這裡是小啊嗚的學習課程資料整理。好記性不如爛筆頭,今天也是努力進步的一天。一起加油高階吧!
文件--
> 單詞1
,單詞2
單詞1 出現的次數 單詞出現的位置; 單詞2 單詞2出現的位置 ...
正排索引:在搜尋欄輸入id查詞條
(已知id)
單詞1---
>文件1
,文件2,文件3
單詞2--
->文件1,文件2
倒排索引:
將搜尋框中的詞進行搜尋查到哪些id包含這個詞,在查這些id,找到詞條
(通過分詞查出id)
(1)不需要鎖,提公升併發能力,避免鎖的問題。
(2)資料不變,一直儲存在os cache中,只要cache記憶體足夠。
(3)filter cache一直駐留在記憶體,因為資料不變。
(4)便於資料壓縮,可以大幅度提高壓縮率,節省cpu和io開銷。
(5)在處理複雜的多關鍵字查詢時,可在倒排表中先完成查詢的並、交等邏輯運算,得到結果後再對記錄進行訪問,這樣把對文件的查詢轉換為位址集合的運算,從而提高查詢速度。
正排索引和倒排索引的區別簡單記為:
正排索引:文件 --
-> 單詞
倒排索引:單詞 --
-> 文件
倒排索引有著廣泛的應用場景,比如:
搜尋引擎、大規模資料庫索引、文件檢索、多**檢索/資訊檢索領域等等。
總之,倒排索引在檢索領域是很重要的一種索引機制。
ending!
更多課程知識學習記錄隨後再來吧!
就醬,嘎啦!
注:1、人生在勤,不索何獲。
2、正排索引和倒排索引的區別參見博文:
正排索引與倒排索引
什麼是正排索引 forward index 由key查詢實體的過程,是正排索引.什麼是倒排索引 inverted index 由item查詢key的過程,是倒排索引。倒排索引可以理解為map item,list id 能夠由查詢詞快速 時間複雜度o 1 找到包含這個查詢詞的檔案的資料結構。舉例 文件...
正排索引和倒排索引簡單介紹
在搜尋引擎中,資料被爬取後,就會建立index,方便檢索。在工作中經常會聽到有人問,你這個index是正排的還是倒排的?那麼什麼是正排呢?什麼又是倒排呢?下面是一些簡單的介紹。網頁a中的內容片段 tom is a boy.tom is a student too.網頁b中的內容片段 jon work...
搜尋引擎之正排與倒排索引
正排索引 正向索引 正排表是以文件的id為關鍵字,表中記錄文件中每個字的位置資訊,查詢時掃瞄表中每個文件中字的資訊直到找出所有包含查詢關鍵字的文件。正排表結構如圖1所示,這種組織方法在建立索引的時候結構比較簡單,建立比較方便且易於維護 因為索引是基於文件建立的,若是有新的文件加入,直接為該文件建立乙...