MySQL实战15 索引优化

1.索引使用测试

1.1创建test表(测试表)

drop table if exists test;
create table test
(
    id int primary key auto_increment,
    c1 varchar(10),
    c2 varchar(10),
    c3 varchar(10),
    c4 varchar(10),
    c5 varchar(10)
)
    ENGINE = INNODB
    default CHARSET = utf8;
insert into test(c1, c2, c3, c4, c5)
values ('a1', 'a2', 'a3', 'a4', 'a5');
insert into test(c1, c2, c3, c4, c5)
values ('b1', 'b2', 'b3', 'b4', 'b5');
insert into test(c1, c2, c3, c4, c5)
values ('c1', 'c2', 'c3', 'c4', 'c5');
insert into test(c1, c2, c3, c4, c5)
values ('d1', 'd2', 'd3', 'd4', 'd5');
insert into test(c1, c2, c3, c4, c5)
values ('e1', 'e2', 'e3', 'e4', 'e5');
insert into test(c1, c2, c3, c4, c5)
values ('f1', 'f2', 'f3', 'f4', 'f5');
insert into test(c1, c2, c3, c4, c5)
values ('g1', 'g2', 'g3', 'g4', 'g5');

1.2.创建索引

create index  idx_test_c1234 on test(c1, c2, c3, c4);
show index from test;
image.png

1.3.分析以下Case索引使用情况

Case 1:

explain select * from test where c1 ='a1' and c2 ='a2' and c3 ='a3' and c4 ='a4';

explain select * from test where c4 ='a4' and c3 ='a3' and c1 ='a1' and c2 ='a2';
image.png

分析:

  1. 创建复合索引的顺序为c1,c2,c3,c4。
  2. 上述2组explain执行的结果都一样:type=ref,key_len=132,ref=const,const,const,const。
结论:在执行常量等值查询时,改变索引列的顺序并不会更改explain的执行结果,因为mysql底层优化器会进行优化,但是推荐按照索引顺序列编写sql语句。

Case 2:

explain  select * from test where c1 ='a1' and c2 ='a2'
image.png
explain  select * from test where c1 ='a1' and c2 ='a2'and c3 >'a3' and c4 ='a4'
image.png

分析:

当出现范围的时候,type=range,key_len=99,比不用范围key_len=66增加了,说明使用上了索引,但对比Case1中执行结果,说明c4上索引失效。

结论:范围右边索引列失效,但是范围当前位置(c3)的索引是有效的,从key_len=99可证明。

Case 2.1:

explain  select * from test where c1 ='a1' and c2 ='a2'and c4 >'a4' and c3 ='a3';
image.png

分析:

与上面explain执行结果对比,key_len=132说明索引用到了4个,因为对此sql语句mysql底层优化器会进行优化:范围右边索引列失效(c4右边已经没有索引列了),注意索引的顺序(c1,c2,c3,c4),所以c4右边不会出现失效的索引列,因此4个索引全部用上。

结论:范围右边索引列失效,是有顺序的:c1,c2,c3,c4,如果c3有范围,则c4失效;如果c4有范围,则没有失效的索引列,从而会使用全部索引。

Case 2.2:

explain  select * from test where c1 >'a1' and c2 ='a2'and c3 ='a3' and c4 ='a4';
image.png

分析:

如果在c1处使用范围,则type=ALL,key=Null,索引失效,全表扫描,这里违背了最佳左前缀法则,因为c1主要用于范围,而不是查询。

解决方式使用覆盖索引。

结论:在最佳左前缀法则中,如果最左前列(带头大哥)的索引失效,则后面的索引都失效。

Case 3:

explain  select * from test where c1 ='a1' and c2 ='a2' and c4 ='a4' order by c3;
image.png

分析:

利用最佳左前缀法则:中间兄弟不能断,因此用到了c1和c2索引(查找),从key_len=66,ref=const,const,c3索引列用在排序过程中。

Case 3.1:

explain  select * from test where c1 ='a1' and c2 ='a2'  order by c3;
image.png

分析:

从explain的执行结果来看:key_len=66,ref=const,const,从而查找只用到c1和c2索引,c3索引用于排序。

Case 3.2:

explain  select * from test where c1 ='a1' and c2 ='a2'  order by c4;
image.png

分析:

从explain的执行结果来看:key_len=66,ref=const,const,查询使用了c1和c2索引,由于用了c4进行排序,跳过了c3,出现了Using filesort。

Case 4:

explain  select * from test where c1 ='a1' and c5 ='a5'  order by c2,c3;
image.png

分析:

查找只用到索引c1,c2和c3用于排序,无Using filesort。

Case 4.1:

explain  select * from test where c1 ='a1' and c5 ='a5'  order by c3,c2;
image.png

分析:

和Case 4中explain的执行结果一样,但是出现了Using filesort,因为索引的创建顺序为c1,c2,c3,c4,但是排序的时候c2和c3颠倒位置了。

Case 4.2:

explain  select * from test where c1 ='a1' and c2 ='a2'   order by c2,c3;
image.png
explain  select * from test where c1 ='a1' and c2 ='a2' and c5 ='a5'  order by c2,c3;
image.png
explain  select * from test where c1 ='a1' and c2 ='a2'   order by c2,c3;

分析:

在查询时增加了c5,但是explain的执行结果一样,因为c5并未创建索引。

Case 4.3:

explain  select * from test where c1 ='a1' and c2 ='a2' and c5 ='a5'  order by c3,c2;
image.png

分析:

与Case 4.1对比,在Extra中并未出现Using filesort,因为c2为常量,在排序中被优化,所以索引未颠倒,不会出现Using filesort。

Case 5:

explain  select * from test where c1 ='a1' and c4 ='a4'  group by c2,c3;
image.png

分析:

只用到c1上的索引,因为c4中间间断了,根据最佳左前缀法则,所以key_len=33,ref=const,表示只用到一个索引。

Case 5.1:

explain  select * from test where c1 ='a1' and c4 ='a4'  group by c3,c2;
image.png

分析:

对比Case 5,在group by时交换了c2和c3的位置,结果出现Using temporary和Using filesort,极度恶劣。原因:c3和c2与索引创建顺序相反。

Case 6:

explain  select * from test where c1 >'a1'   order by c1;
image.png

分析:

①在c1,c2,c3,c4上创建了索引,直接在c1上使用范围,导致了索引失效,全表扫描:type=ALL,ref=Null。因为此时c1主要用于排序,并不是查询。

②使用c1进行排序,出现了Using filesort。

③解决方法:使用覆盖索引。

explain  select c1 from test where c1 >'a1'   order by c1;
image.png

Case 7:

explain  select c1 from test order by c1 asc ,c2 desc ;
image.png

分析:

虽然排序的字段列与索引顺序一样,且order by默认升序,这里c2 desc变成了降序,导致与索引的排序方式不同,从而产生Using filesort。

Case 8:

explain  select c1 from test where c1 in ('a1','b1') order by c2,c3;
image.png

Case 8.1 :

explain  select c1 from test where c1 in ('a1','b1','c1','d1') order by c2,c3;
image.png

分析:

对于排序来说,多个相等条件也是范围查询

总结:

①MySQL支持两种方式的排序filesort和index,Using index是指MySQL扫描索引本身完成排序。index效率高,filesort效率低。

②order by满足两种情况会使用Using index。

1.order by语句使用索引最左前列。
2.使用where子句与order by子句条件列组合满足索引最左前列。

③尽量在索引列上完成排序,遵循索引建立(索引创建的顺序)时的最佳左前缀法则。

④如果order by的条件不在索引列上,就会产生Using filesort。

⑤group by与order by很类似,其实质是先排序后分组,遵照索引创建顺序的最佳左前缀法则。注意where高于having,能写在where中的限定条件就不要去having限定了。

通俗理解口诀:

全值匹配我最爱,最左前缀要遵守;
带头大哥不能死,中间兄弟不能断;
索引列上少计算,范围之后全失效;
LIKE百分写最右,覆盖索引不写星;
不等空值还有or,索引失效要少用。

补充:in和exsits优化

原则:小表驱动大表,即小的数据集驱动大的数据集

in:当B表的数据集必须小于A表的数据集时,in优于exists

select * fromA where id in (selectid from B)
等价于:
for selectid from B for select * fromA whereA.id = B.id

exists:当A表的数据集小于B表的数据集时,exists优于in

将主查询A的数据,放到子查询B中做条件验证,根据验证结果(true或false)来决定主查询的数据是否保留

select * fromA where exists (select **1** fromB whereB.id = A.id)
等价于:
for select * from A for select * fromB whereB.id = A.id
A表与B表的ID字段应建立索引
  1. EXISTS (subquery)只返回TRUE或FALSE,因此子查询中的SELECT * 也可以是SELECT 1或select X,官方说法是实际执行时会忽略SELECT清单,因此没有区别
  2. EXISTS子查询的实际执行过程可能经过了优化而不是我们理解上的逐条对比
  3. EXISTS子查询往往也可以用JOIN来代替,何种最优需要具体问题具体分析

2.索引最佳实践

使用的表
CREATE TABLE `employees` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
  `age` int(11) NOT NULL DEFAULT '0' COMMENT '年龄',
  `position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位',
  `hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间',
  PRIMARY KEY (`id`),
  KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='员工记录表';

INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei', 23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());
1.全值匹配
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei';
image.png
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;
image.png
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
image.png
2.最佳左前缀法则

如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。

EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';
image.png
EXPLAIN SELECT * FROM employees WHERE position = 'manager';
image.png

跳过了索引中最左前列 而导致不走索引

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
image.png

name是最左前列 走索引

3.不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描

走索引

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';
image.png
4.存储引擎不能使用索引中范围条件右边的列
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
image.png
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';
image.png
5.尽量使用覆盖索引(只访问索引的查询(索引列包含查询列)),减少select *语句
EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
image
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
image
6.mysql在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
EXPLAIN SELECT * FROM employees WHERE name != 'LiLei'
image
7.is null,is not null 也无法使用索引
EXPLAIN SELECT * FROM employees WHERE name is null
image
8.like以通配符开头('$abc...')mysql索引失效会变成全表扫描操作
EXPLAIN SELECT * FROM employees WHERE name like '%Lei'
image
EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'
image

问题:解决like'%字符串%'索引不被使用的方法?

a)使用覆盖索引,查询字段必须是建立覆盖索引字段

EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';
image

b)当覆盖索引指向的字段是varchar(380)及380以上的字段时,覆盖索引会失效!

9.字符串不加单引号索引失效
EXPLAIN SELECT * FROM employees WHERE name = '1000';

EXPLAIN SELECT * FROM employees WHERE name = 1000;
image
10.少用or,用它连接时很多情况下索引会失效
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';
image
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266