如果一個索引節點為128B,mysql手機客戶端_圖解MySQL索引--B-Tree(B+Tree)

 2023-11-18 阅读 20 评论 0

摘要:如果一個索引節點為128B,看了很多關于索引的博客,講的大同小異。但是始終沒有讓我明白關于索引的一些概念,如B-Tree索引,Hash索引,唯一索引....或許有很多人和我一樣,沒搞清楚概念就開始研究B-Tree,B+Tree等結構,導致在

5aa92a3c8759ecc0ffc44b03e1af6430.png

如果一個索引節點為128B,看了很多關于索引的博客,講的大同小異。但是始終沒有讓我明白關于索引的一些概念,如B-Tree索引,Hash索引,唯一索引....或許有很多人和我一樣,沒搞清楚概念就開始研究B-Tree,B+Tree等結構,導致在面試的時候答非所問!本文中有關存儲引擎請查看MySQL存儲引擎-InnoDB和MyISAM

索引是什么?

索引是幫助MySQL高效獲取數據的數據結構。

索引能干什么?

提高數據查詢的效率。

索引:排好序的快速查找數據結構!索引會影響where后面的查找,和order by 后面的排序。

一、索引的分類

1??從存儲結構上來劃分:BTree索引(B-Tree或B+Tree索引),Hash索引,full-index全文索引,R-Tree索引。

2??從應用層次來分:普通索引,唯一索引,復合索引

3??根據中數據的物理順序與鍵值的邏輯(索引)順序關系:聚集索引,非聚集索引。

1??中所描述的是索引存儲時保存的形式,2??是索引使用過程中進行的分類,兩者是不同層次上的劃分。不過平時講的索引類型一般是指在應用層次的劃分。

就像手機分類:安卓手機,IOS手機 與 華為手機,蘋果手機,OPPO手機一樣。

普通索引:即一個索引只包含單個列,一個表可以有多個單列索引

唯一索引:索引列的值必須唯一,但允許有空值

復合索引:即一個索引包含多個列

聚簇索引(聚集索引):并不是一種單獨的索引類型,而是一種數據存儲方式。具體細節取決于不同的實現,InnoDB的聚簇索引其實就是在同一個結構中保存了B-Tree索引(技術上來說是B+Tree)和數據行。

非聚簇索引:不是聚簇索引,就是非聚簇索引(認真臉)。

二、索引的底層實現

mysql默認存儲引擎innodb只顯式支持B-Tree( 從技術上來說是B+Tree)索引,對于頻繁訪問的表,innodb會透明建立自適應hash索引,即在B樹索引基礎上建立hash索引,可以顯著提高查找效率,對于客戶端是透明的,不可控制的,隱式的。

不談存儲引擎,只討論實現(抽象)

Hash索引

基于哈希表實現,只有精確匹配索引所有列的查詢才有效,對于每一行數據,存儲引擎都會對所有的索引列計算一個哈希碼(hash code),并且Hash索引將所有的哈希碼存儲在索引中,同時在索引表中保存指向每個數據行的指針。

aa3c6ef1973dff61e116db1764204703.png

B-Tree索引(MySQL使用B+Tree)

B-Tree能加快數據的訪問速度,因為存儲引擎不再需要進行全表掃描來獲取數據,數據分布在各個節點之中。

4526b29bd6edb07120a88880ad02053d.png

B+Tree索引

是B-Tree的改進版本,同時也是數據庫索引索引所采用的存儲結構。數據都在葉子節點上,并且增加了順序訪問指針,每個葉子節點都指向相鄰的葉子節點的地址。相比B-Tree來說,進行范圍查找時只需要查找兩個節點,進行遍歷即可。而B-Tree需要獲取所有節點,相比之下B+Tree效率更高。

e9314b647481ab7692d2208bac4fcf36.png
結合存儲引擎來討論(一般默認使用B+Tree)

案例:假設有一張學生表,id為主鍵

idnamebirthday1Tom1996-01-012Jann1996-01-043Ray1996-01-084Michael1996-01-105Jack1996-01-136Steven1996-01-237Lily1996-01-25

在MyISAM引擎中的實現(二級索引也是這樣實現的)

25d69bb6698ca4603c4059fac68b1d01.png

在InnoDB中的實現

df159d01c72329489963d0a3272453a0.png

1c35fcd1329cbb5d7b3ac60ed7ae7003.png

三、問題

問:為什么索引結構默認使用B-Tree,而不是hash,二叉樹,紅黑樹?

hash:雖然可以快速定位,但是沒有順序,IO復雜度高。

二叉樹:樹的高度不均勻,不能自平衡,查找效率跟數據有關(樹的高度),并且IO代價高。

紅黑樹:樹的高度隨著數據量增加而增加,IO代價高。

問:為什么官方建議使用自增長主鍵作為索引。

結合B+Tree的特點,自增主鍵是連續的,在插入過程中盡量減少頁分裂,即使要進行頁分裂,也只會分裂很少一部分。并且能減少數據的移動,每次插入都是插入到最后。總之就是減少分裂和移動的頻率。

插入連續的數據:

496f92026d4a35b21776bb0a1c5eb7da.gif

插入非連續的數據

e5d5386f282e635a885d248a9f93d72a.gif
原作者::浪人
原文鏈接:https://www.cnblogs.com/liqiangchn/p/9060521.html
原出處:博客園

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/3/178769.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息