Skip to content

Commit 3e70c51

Browse files
committed
MySQL index 原理
1 parent c47de2b commit 3e70c51

1 file changed

Lines changed: 24 additions & 0 deletions

File tree

MD/MySQL-Index.md

Lines changed: 24 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,24 @@
1+
# MySQL 索引原理
2+
3+
现在互联网应用中对数据库的使用多数都是读较多,比例可以达到 `10:1`。然后数据库在做查询时 `IO` 消耗较大,所以如果能把一次查询的 `IO` 次数控制在常量级那对数据库的性能提升将是非常明显的。因此基于 `B+ Tree` 的索引结构出现了。
4+
5+
6+
## B+ Tree 的数据结构
7+
8+
![](https://ws2.sinaimg.cn/large/006tKfTcgy1fn10d6j9sij30hc08cab3.jpg)
9+
10+
如图所示是 `B+ Tree` 的数据结构。是有一个一个的磁盘块组成的树形结构,每个磁盘块有数据项和指针组成。
11+
12+
> 所有的数据都是存放在叶子节点,非叶子节点不存放数据。
13+
14+
## 查找过程
15+
16+
以磁盘块1为例,指针 P1 表示小于17的磁盘块,P2表示在 `17~35` 之间的磁盘块,P3 则表示大于35的磁盘块。
17+
18+
比如要查找数据项99,首先将磁盘块1 load 到内存中,发生 1 次 `IO`。接着通过二分查找发现 99 大于 35,所以找到了 P3 指针。通过P3 指针发生第二次 IO 将磁盘块4加载到内存。再通过二分查找发现大于87,通过 P3 指针发生了第三次 IO 将磁盘块11 加载到内存。最后再通过一次二分查找找到了数据项99。
19+
20+
由此可见,如果一个几百万的数据查询只需要进行三次 IO 即可找到数据,那么整个效率将是非常高的。
21+
22+
由图可见,查询需要经历几次 IO 是由树的高度来决定的,而树的高度又有磁盘块,数据项的大小决定的。
23+
24+
磁盘块越大,数据项越小那么数的高度就越低。这也就是为什么索引字段要尽可能小的原因。

0 commit comments

Comments
 (0)