為什麼mysql索引用B 樹而不用雜湊表？

hash 索引結構的特殊性，其檢索效率非常高，索引的檢索可以一次定位，不像b+tree 索引需要從根節點到枝節點，最後才能訪問到頁節點這樣多次的io訪問，所以 hash 索引的查詢效率要遠高於 b+tree 索引。

可能很多人又有疑問了，既然 hash 索引的效率要比 b+tree 高很多，為什麼大家不都用 hash 索引而還要使用 b+ree 索引呢？任何事物都是有兩面性的，hash 索引也一樣，雖然 hash 索引效率高，但是 hash 索引本身由於其特殊性也帶來了很多限制和弊端，主要有以下這些。

hash 索引僅僅能滿足」=」,」in」和」<=>」查詢，不能使用範圍查詢。

由於 hash 索引比較的是進行 hash 運算之後的 hash 值，所以它只能用於等值的過濾，不能用於基於範圍的過濾，因為經過相應的 hash 演算法處理之後的 hash 值的大小關係，並不能保證和hash運算前完全一樣。

hash 索引無法被用來避免資料的排序操作。

由於 hash 索引中存放的是經過 hash 計算之後的 hash 值，而且hash值的大小關係並不一定和 hash 運算前的鍵值完全一樣，所以資料庫無法利用索引的資料來避免任何排序運算；

hash 索引不能利用部分索引鍵查詢。

對於組合索引，hash 索引在計算 hash 值的時候是組合索引鍵合併後再一起計算 hash 值，而不是單獨計算 hash 值，所以通過組合索引的前面乙個或幾個索引鍵進行查詢的時候，hash 索引也無法被利用。

hash 索引在任何時候都不能避免表掃瞄。

前面已經知道，hash 索引是將索引鍵通過 hash 運算之後，將 hash運算結果的 hash 值和所對應的行指標資訊存放於乙個 hash 表中，由於不同索引鍵存在相同 hash 值，所以即使取滿足某個 hash 鍵值的資料的記錄條數，也無法從 hash 索引中直接完成查詢，還是要通過訪問表中的實際資料進行相應的比較，並得到相應的結果。

hash 索引遇到大量hash值相等的情況後效能並不一定就會比b+tree索引高。

對於選擇性比較低的索引鍵，如果建立 hash 索引，那麼將會存在大量記錄指標資訊存於同乙個 hash 值相關聯。這樣要定位某一條記錄時就會非常麻煩，會浪費多次表資料的訪問，而造成整體效能低下

簡單地說，雜湊索引就是採用一定的雜湊演算法，把鍵值換算成新的雜湊值，檢索時不需要類似b+樹那樣從根節點到葉子節點逐級查詢，只需一次雜湊演算法即可立刻定位到相應的位置，速度非常快。

b+樹索引和雜湊索引的明顯區別是：

如果是等值查詢，那麼雜湊索引明顯有絕對優勢，因為只需要經過一次演算法即可找到相應的鍵值；當然了，這個前提是，鍵值都是唯一的。如果鍵值不是唯一的，就需要先找到該鍵所在位置，然後再根據鍊錶往後掃瞄，直到找到相應的資料；

如果是範圍查詢檢索，這時候雜湊索引就毫無用武之地了，因為原先是有序的鍵值，經過雜湊演算法後，有可能變成不連續的了，就沒辦法再利用索引完成範圍查詢檢索；

同理，雜湊索引也沒辦法利用索引完成排序，以及like 『***%』這樣的部分模糊查詢（這種部分模糊查詢，其實本質上也是範圍查詢）；

雜湊索引也不支援多列聯合索引的最左匹配規則；

b+樹索引的關鍵字檢索效率比較平均，不像b樹那樣波動幅度大，在有大量重複鍵值情況下，雜湊索引的效率也是極低的，因為存在所謂的雜湊碰撞問題。

為什麼mysql索引用B 樹而不用雜湊表？

為什麼Mysql用B 樹做索引而不用B 樹

MySQL索引為什麼選擇B 樹而不是B樹

MySQL為什麼用B 樹，而不用B樹？

為什麼mysql索引用B 樹而不用雜湊表？

為什麼Mysql用B 樹做索引而不用B 樹

MySQL索引為什麼選擇B 樹而不是B樹

MySQL為什麼用B 樹，而不用B樹？

相關推薦