mysql使用索引提高查询效率

mysql单表中数据量到达一定数量后,查询效率会变得很低,使用索引可以有效地提高mysql的查询效率.但是索引使用不当,会使索引失效,起不到提升效率的作用,在实际项目中,要做好索引的优化,合理的使用索引。关于索引的优化,可以参考这篇文章,传送门
为了分析sql语句执行效率,使用explain 分析sql语句
使用explain关键字可以模拟优化器执行sql查询语句,从而得知MySQL 是如何处理sql语句。

+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------------+
| id | select_type | table | partitions | type  | possible_keys | key     | key_len | ref   | rows | filtered | Extra       |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------------+

id

select 查询的序列号,包含一组可以重复的数字,表示查询中执行sql语句的顺序。一般有三种情况:
第一种:id全部相同,sql的执行顺序是由上至下;
第二种:id全部不同,sql的执行顺序是根据id大的优先执行;
第三种:id既存在相同,又存在不同的。先根据id大的优先执行,再根据相同id从上至下的执行。

select_type

select 查询的类型,主要是用于区别普通查询,联合查询,嵌套的复杂查询
simple:简单的select 查询,查询中不包含子查询或者union
primary:查询中若包含任何复杂的子查询,最外层查询则被标记为primary
subquery:在select或where 列表中包含了子查询
derived:在from列表中包含的子查询被标记为derived(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
union:若第二个select出现在union之后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived
union result:从union表获取结果的select

partitions

表所使用的分区,如果要统计十年公司订单的金额,可以把数据分为十个区,每一年代表一个区。这样可以大大的提高查询效率。

type

这是一个非常重要的参数,连接类型,常见的有:all , index , range , ref , eq_ref , const , system , null 八个级别。
性能从最优到最差的排序:system > const > eq_ref > ref > range > index > all
在代码中,若保证查询至少达到range级别或者最好能达到ref则算是一个优秀而又负责的程序员。
all:(full table scan)全表扫描无疑是最差,若是百万千万级数据量,全表扫描会非常慢。
index:(full index scan)全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。
range:只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引文件扫描要快。sql语句中一般会有between,in,>,< 等查询。
ref:非唯一性索引扫描,本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事,匹配的结果是多个并非唯一值。
eq_ref:唯一性索引扫描,对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录,
const:表示通过索引一次就可以找到,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快,若将主键至于where列表中,MySQL就能将该查询转换为一个常量。
system:表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可

possible_keys

显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。仅供参考使用。

key

显示查询语句实际使用的索引。若为null,则表示没有使用索引。

key_len

显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。key_len 显示的值为索引字段的最可能长度,并非实际使用长度,即key_len是根据表定义计算而得,并不是通过表内检索出的。

ref

显示索引的哪一列或常量被用于查找索引列上的值。

rows

根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,值越大越不好。

filtered

一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。

extra

Using filesort: 说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。
Using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。 出现这个更要立刻优化sql。
Using index: 表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。
Covering Index:覆盖索引也叫索引覆盖,就是select 的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。
Using index condition: 在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。
Using where: 表明使用了where 过滤
Using join buffer: 表明使用了连接缓存
impossible where: where 语句的值总是false,不可用,不能用来获取任何元素
distinct: 优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

在查询中使用索引

先创建两个表

CREATE TABLE user
(
  id   int(11) UNSIGNED AUTO_INCREMENT
    PRIMARY KEY,
  name char(10) NOT NULL,
  age  int      NOT NULL
)
  ENGINE = InnoDB;
CREATE TABLE phone
(
  id    int(11) UNSIGNED AUTO_INCREMENT
    PRIMARY KEY,
  uid   int(11) UNSIGNED NOT NULL,
  phone char(10)         NOT NULL
)
  ENGINE = InnoDB;

mysql的主键带有一个主键索引,在创建表的时候已经建立
在简单地查询中使用索引

EXPLAIN SELECT name FROM user

这时候并没有使用索引,因为我们没有加限制条件

EXPLAIN SELECT name FROM user WHERE id=1

这时候索引已经起作用了,是const类型
--
再来看另一种情况

EXPLAIN SELECT id FROM user WHERE id+1 =2


这时候虽然使用了索引,但是索引类型是index类型,效果大打折扣


给user表中的name字段加上索引

ALTER TABLE `user` ADD INDEX `_name`(`name`) USING BTREE;

使用LIKE模糊查询

EXPLAIN SELECT name FROM user WHERE name LIKE '王%'


可以看到,使用了索引,类型为range
换个匹配方式试试

EXPLAIN SELECT name FROM user WHERE name LIKE '%王'


这时候,虽然使用了索引,但是索引类型是index,全局索引扫描,效率是很低的.


再来试一下OR连接查询

EXPLAIN SELECT id,uid FROM phone WHERE id=1 or id =2


使用了索引,是range类型


再来试一下 IN约束查询,这两次查询结果是相同的

EXPLAIN SELECT id,uid FROM phone WHERE id IN (1,2)


同样,使用了索引,是range类型


再来试一下OR查询的另一种情况

EXPLAIN SELECT id,uid FROM phone WHERE id = 1 OR  uid=2


这时候会发现,竟然没有使用索引,type是ALL,因为这次OR的连个字段只有id有索引,uid没有索引,所以在查询的时候就会放弃使用索引,使用全局扫描.


这种情况是可以使用union 连接查询优化的

EXPLAIN SELECT id
        FROM phone
        WHERE id = 1
        UNION ALL
        SELECT uid
        FROM phone
        WHERE uid = 2

我们可以看到,在查询id时使用里索引,查询uid时,因为uid没有索引,所以没有使用索引.


再来看一下很常用的连接查询,

EXPLAIN SELECT user.id, name, uid, phone
        FROM user
               JOIN phone ON user.id = 1 AND uid = 2


(在使用连接查询的时候尽量使用join,不要使用left joinright join,在使用join查询的时候,mysql解析器会自动选择用小表驱动大表,这样可以提高查询效率,如果使用left join或者right join会指定驱动表,有时候会降低查询效率)
这时候只有在查询user表时使用了索引,在查询phone表时没有使用索引.因为在ON的约束条件中,id是有索引的,而uid没有索引,所以在查询的时候不会使用索引.
这时候给uid字段加上索引,看看效果.
添加索引

ALTER TABLE `phone` ADD INDEX `_uid`(`uid`) USING BTREE;

跟刚才一样,使用连接查询

EXPLAIN SELECT user.id, name, uid, phone
        FROM user
               JOIN phone ON user.id = 1 AND uid = 2

这时候可以看到,查询user表和phone表时,都使用了索引。

总结

  • 在有限制条件(WHERE,ON)的的查询中,对约束字段尽量都加上索引.在数据量很大的时候,提升查询效率特别明显
  • 不要在约束条件上进行运算,在查询中对索引字段进行运算,会使用index索引,效果大打折扣
  • 在使用LIKE 模糊匹配时,尽量用'XXX%',不要使用'%XXX'
  • 在经常删除、更新数据的字段和数据量不大的时候(网上说小于百万,因为我没有试验过,不能确定),没有必要使用索引,因为索引会占据磁盘空间,而且也会降低插入和更新数据的效率。
  • 在查询中不会使用约束条件的字段也不用加索引,比如在例子中,从来没有对phone表中的phone字段使用过WHEREON条件,所以没有必要给phone字段加索引。
  • 查询中,使用OR约束条件时,OR两边的字段都必须有索引,如果只有一边的字段有索引,可以使用union连接查询提高效率。
  • 在连接查询中,对两个表的关联字段加上索引,可以有效地提高查询效率。
  • NULL会导致索引形同虚设,所以在设计表结构时应避免NULL 的存在(用其他方式表达你想表达的NULL,比如 -1?)

最后感谢在网上无私分享的前辈们

我也是刚刚在学习mysql优化方面的知识,一边学习,一边总结,文中如果有错误的地方,还请各位大神批评指正

推荐阅读更多精彩内容

  • Mysql概述 数据库是一个易于访问和修改的信息集合。它允许使用事务来确保数据的安全性和一致性,并能快速处理百万条...
    彦帧阅读 9,563评论 7 438
  • 转 # https://www.cnblogs.com/easypass/archive/2010/12/ 08/...
    lvcyong阅读 3,550评论 0 42
  • MYSQL 基础知识 1 MySQL数据库概要 2 简单MySQL环境 3 数据的存储和获取 4 MySQL基本操...
    Kingtester阅读 5,061评论 5 117
  • 亲子日记第149篇2010年3月7日,星期三,天气阴 晚上下班后我和儿子一起去了超市。刚进超市突然发现忘记带手机了...
    海内存知己_bd9e阅读 18评论 0 2
  • 12月16日下午,Raysonic 与居然顶层携手打造的「江欣宜的陈设艺术」沙龙活动,在北京顶层设计中心成功落幕,...
    定制家居圈ING阅读 72评论 0 0