mysql-查询优化处理

下面是mysql查询的路径


mysql查询执行路径

下面简单的理解一下mysql服务器的查询过程

查询缓存

在解析一个查询语句之前,如果查询缓存是打开的,那么mysql会优先检查这个查询是否命中缓存中的数据。如果命中查询缓存,则在检查用户权限后直接返回查询结果。否则进入下一阶段的处理。

解析器

mysql通过关键字将sql语句进行解析,并生成解析树。解析器使用mysql语法规则验证和解析查询。例如,它将验证是否使用错误的关键字,或者使用关键字的顺序是否正确等,还有引号能否前后匹配。

预处理器

预处理器则根据mysql规则进一步检查解析树是否合法,例如,这里将检查数据表和数据列是否存在,还会解析名字和别名,看是否有歧义等。下一步预处理还会验证权限。

查询优化器

一条查询可以有很多种执行方式,最后都返回相同的结果,优化器的作用就是找到这其中最好的执行计划。

mysql使用基于成本的优化器,他将尝试预测一个查询使用某种执行计划时的成本,并选择其中成本最小的一个。可以通过查询当前会话的last_query_cost的值来得知mysql计算当前的当前查询的成本。

mysql> select sql_no_cache count(*) from renren.applicants;
+----------+
| count(*) |
+----------+
| 499362 |
+----------+
1 row in set (0.97 sec)
mysql> show status like 'last_query_cost';
+-----------------+---------------+
| Variable_name | Value |
+-----------------+---------------+
| Last_query_cost | 125297.999000 |
+-----------------+---------------+
1 row in set (0.02 sec)

这个结果表示mysql的优化器认为大概需要做125297个数据页的随机查询才能完成上面的查询,这是根据一系列的统计信息计算的来的。 sql_no_cache代表不读取缓存。

下面是一些mysql能够处理的优化类型:

重新定义关联表的顺序

数据表的关联并不是总按照查询指定的顺序进行。

将外连接转换成内连接

并不是所有的outer join 语句都必须以外连接的方式执行。例如where条件、库表结构都可能会让外连接等价于一个内连接。mysql能够识别这点并重写查询,让其可以调整关联顺序。

使用等价变换规则

mysql可以使用等价变化来简化并规范表达式。它可以合并和减少一些比较,还可以移除恒成立和不成立的判断。例如,(5=5 and a>5) 被该写成 a>5,还有(a<b and b=c) and a=5 会该写成 b>5 and b=c and a=5。

覆盖索引扫描

当索引中的列包含所有查询中需要的列时,mysql就可以使用索引返回需要的数据,而无须查询对应的数据行。

子查询优化

mysql在某些情况下可以将子查询转换成一种效率更高的形式,从而减少多个子查询多次对数据的访问。
(未完)

等值传播

如果两个列的值通过等式关联,mysql能够把其中一列的where条件传递到另一列上,例如:

select film.film_id from film inner join film_actor using(film_id) 
where film.film_id > 500;

因这里使用using等值关联,mysql知道where子句不仅适用于film,而且对于film_actor同样适用。

列表in()的比较

很多数据库中in()完全等同于多个or条件的子句,但在mysql中,将in()列表中的数据先进行排序,然后通过二分查找方式确定列表中的值是否满足条件,in列表中有大量取值时,mysql来说处理速度更快。(并不是指mysql 中in列表的值越多查询越快,是与其他数据库对比来说相同的in数据量,mysql速度会更快)

提前终止查询

在发现已经满足查询需求的时候,mysql总是能够立即终止查询。最典型的是使用limit子句。此外发现一个不成立条件,如..where film_id = -1,这类查询在优化阶段就已终止。当存储引擎需要检索“不同取值”或者判断存在性的时候,mysql会用此类优化。类似这种“不同值/不存在”的优化一般可用于distinct、not exist() 或者 left join类型的查询。

优化count()、min()、max()

在B-tree索引中,找某列最小值,只需查询B-tree索引最左端记录,最大值查询B-tree最右端记录,优化器会将这个表达式作为一个常熟对待。在没有任何where条件的count(*)查询,在myisam引擎中可以直接读取已存储好的行数信息。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 121,193评论 16 134
  • 系统层面(基本不用动,看了下,买的云服务器基本都已经优化过了) 内核相关参数(/etc/sysctl.conf) ...
    神奇大叶子阅读 1,295评论 0 4
  • mysql性能优化-慢查询分析、优化索引和配置 分类:Mysql/postgreSQL 目录 一、优化概述 二、查...
    CaesarXia阅读 2,473评论 1 46
  • 上年初紧张的工作,频繁的感冒,严重的贫血,四肢的无力,我整个人摇摇欲坠,面临轰然倒塌。对生活失去了信心,感觉前途一...
    编织梦想阅读 81评论 1 2
  • 写作第五天 写作开始变得有些为难了,不能像前两天那样拿笔就写,现在要思考写什么了。不过这是写作不可避免的阶段,而我...
    wanshican阅读 110评论 0 0