比如 in 这个查询 in(1,2,3,4) 索引是分别拿 1,2,3,4 去索引查,查四次索引,还是查一次索引
如果是查四次索引,那我们查出来的数据很多的话比如说一千条,io 的次数不就超级多了
1
LYEHIZRF 2020-05-15 16:34:47 +08:00
??
|
2
Philyu 2020-05-15 16:49:18 +08:00
mysql 的索引基础结构是 B+树,如 id in ( 1,2,3,4 ),那么会将 id 列的索引加载到内容,分布找到对应 id=1,2,3,4 的四行数据的偏移量,最少只需要一次 IO 。具体几次,涉及到你这表每一行的数据大小,因为磁盘读取,一次 IO 是 64K,有可能这 4 条数据都在了。
|
4
Philyu 2020-05-15 17:02:41 +08:00
正常是这样,而且 mysql 会将部分用到的索引加载到内存,4 次或 1 次都很快;如果 in 里面是连续的值,大概率会被优化器优化。
|
5
noble4cc OP @Philyu 我的理解会把索引的 root 加载到内存,每次从 root 向下找,1,2,3,4 分别走四次 root,分别往下找,如果欧优化的话一次找到 1,2,3,4 就不再走 root 找了,这样理解对吗
|
6
2379920898 2020-05-15 17:07:57 +08:00
光 mysql 索引这一部分就可以写一本书,并且 50%的程序员没有掌握这项技能
|
7
2379920898 2020-05-15 17:08:46 +08:00
索引策略很多的,基本上最优的索引策略学下来 要赶上 学两次 C1 证了
|
8
2379920898 2020-05-15 17:09:22 +08:00
IO 和索引不要一起提,毕竟你这样一问,显得很不专业。
|
9
cxshun 2020-05-15 17:10:29 +08:00
@noble4cc #5 其实不需要走四次根结点,因为 B+树的叶子结点是一个链表,它可以在上面找到你所有的数据。所以只会是在取下一个子结点的时候会触发 IO,一般情况下 3-4 次 IO 就可以了。
|
10
noble4cc OP @cxshun 但是如果 id 值比较离散呢,10 10000 1000000 呢,这种恐怕一个叶子节点很难包括在一起,不走 root 怎么个搜出来呢
|
11
shenmimu 2020-05-15 17:17:22 +08:00
索引逻辑结构是有序的 B+树,查找一列时间复杂度是 O(log(n)),物理结构是分页的硬盘存储
in 查询结果和分别查询结果相同,读多少次索引取决与引擎有没有预加载到条件需要的页, 再加上多次从索引到聚集索引的 fetch 和多次网络开销 in 查询绝大部分情况下比多次查询更快 |
12
Philyu 2020-05-15 17:21:27 +08:00
我明白 lz 的意思,其实没有你想象的那么多 IO,首先索引是有序的,可以连续读取;就算 key 很分散,IO 次数也还跟 key 的数量在一个量级;查询到的记录再多,还是成片的,可以连续读取。
|
13
thinkmore 2020-05-19 15:48:16 +08:00
|
14
thinkmore 2020-05-19 15:52:00 +08:00
@thinkmore 贴错了,这个才是 https://juejin.im/post/5ea273f951882573cd41c7a4.
如果对于 in 有疑问,你完全可以 explain 分析下,看看是怎么走的 |