索引就是把乙個關鍵字與它對應的記錄相關聯的過程,乙個索引由若干個索引項構成,每個索引項至少應包含關鍵字和其對應的記錄在儲存器中的位置等資訊。索引技術是組織大型資料庫以及磁碟檔案的一種重要技術。索引按照結構可以分為線性索引、樹形索引和多級索引。這裡只**線性索引,即將索引項集合組織為線性結構,也稱為索引表。其中又分為:稠密索引、分塊索引和倒排索引。
分塊索引是把資料集的記錄分成了若干塊,並且這些塊需要滿足兩個條件:塊內無序
塊間有序,例如要求第二塊所有記錄的關鍵字均要大於第一塊中所有記錄的關鍵字。
倒排索引的通用結構是:假設有兩句句子,我們之後要對其進行根據關鍵字的查詢。其中記錄號表儲存具有相同關鍵字的所有記錄的記錄號(可以是指向記錄的指標或者是改=該記錄的主關鍵字)。這樣的索引方法就是倒排索引(inverted index)。這種索引表中的每一項都包括乙個屬性值和具有該屬性值的各記錄的位址。(由於不是由記錄來確定屬性值,而是由屬性值來確定記錄的位置,所以稱為倒排索引)
books and friends should be few but good.
a good book is a good friend.
我們忽略掉裡面的複數和大小寫區別,建立倒排索引表如:
單詞文章編號a2
and1be1
book
1,2but
1few
1friend
1,2good
1,2is
2should
1
線性索引查詢
索引就是把乙個關鍵字與它對應的記錄相關聯的過程,乙個索引由若干個索引項構成,每個索引項至少應包含關鍵字和其對應的記錄在儲存器中的位置等資訊。索引技術是組織大型資料庫以及磁碟檔案的一種重要技術。索引按照結構可以分為線性索引 樹形索引和多級索引。所謂的線性索引就是將索引項集合組織為線性結構,也稱為索引表...
線性索引查詢
本文參考自 大話資料結構 資料結構的最終目的是提高資料的處理速度,索引就是為了加快查詢速度而設計得一種資料結構。索引就是把乙個關鍵字與它對應的記錄相關聯的過程。索引按結構可以分為線性索引 樹形索引和多級索引。我們這裡只介紹線性索引。所謂線性索引就是將索引項集合組織為線性結構,也稱為索引表。重點介紹三...
線性索引查詢
索引 就是把乙個關鍵字與它對應的記錄相關聯的過程,乙個索引由若干個索引項構成,每個索引項至少應包含關鍵字和其對應的記錄在儲存器中的位置等資訊。索引按照結構可以分為 線性索引 樹形索引和多級索引。線性索引是將索引項集合組織為線性結構,也稱為索引表。包括稠密索引 分塊索引 倒排索引。乙個完美的引子 將資...