MySQL——优化嵌套查询和分页查询

mark

优化嵌套查询

嵌套查询（子查询）可以使用SELECT语句来创建一个单列的查询结果，然后把这个结果作为过滤条件用在另一个查询中。嵌套查询写起来简单，也容易理解。但是，有时候可以被更有效率的连接（JOIN)替代。

现在假如要找出从来没有在网站中消费的客户，也就是查询在客户customer表中但是不在支付payment表中的客户信息。

嵌套查询：

explain select * from customer where customer_id not in (select customer_id from payment);

mark

连接改写：

explain select * from customer a left join payment b on a.customer_id = b.customer_id where b.customer_id is null;

mark

画外音：连接查询效率更高的原因，是因为MySQL不需要在内存中创建临时表来完成这个逻辑上需要两个步骤的查询工作；并且Not exists表示MYSQL优化了LEFT JOIN，一旦它找到了匹配LEFT JOIN标准的行，就不再搜索了。

优化分页查询

在MySQL中做分页查询，MySQL 并不是跳过 offset 行，而是取 offset+N 行，然后返回放弃前 offset 行，返回 N 行，那当 offset 特别大的时候，效率就非常的低下。例如“limit 1000,20”，此时MySQL排序出前1020条数据后仅仅需要第1001到1020条记录，前1000条数据都会被抛弃，查询和排序的代价非常高。由此可见MySQL的分页处理并不是十分完美，需要我们在分页SQL上做一些优化，要么控制返回的总页数，要么对超过特定阈值的页数进行 SQL 改写。

画外音：控制返回的总页数并不是那么靠谱，毕竟每页的数据量也不能过大，数据多起来之后，控制返回的总页数就变的不现实了。所以还是要对超过特定阈值的页数进行 SQL 改写。

现在假设要对电影表film排序后取某一页数据

explain select * from film order by title limit 50,5;

mark