首页 / MYSQL / MySQL高级之 order by、group by 优化

MySQL高级之 order by、group by 优化

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了MySQL高级之 order by、group by 优化，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4056字，纯文字阅读大概需要6分钟。

内容图文

order by示例

示例数据：

Case 1

Case 2

Case 3

Case 4

结论：order by子句，尽量使用Index方式排序，在索引列上遵循索引的最佳左前缀原则。
复合（联合）索引形如 key (‘A1’,’A2’,’A3’ )，排序的思路一般是，先按照A1来排序，A1相同，然后按照A2排序，以此类推，这样对于（A1）,(A1,A2), (A1,A2,A3)的索引都是有效的，但是对于（A2,A3）这样的索引就无效了。尽量避免因索引字段的缺失或索引字段顺序的不同引起的FileSort排序。

order by 总结

FileSort排序算法

算法一：双路排序算法

只利用ORDERBY子句中包括的列对象进行排序（适用于有BLOB、TEXT类型的列对象参与的排序）

MySQL4.1之前的排序算法，完整实现过程如下：

1) 按索引键或全表扫描的方式，读取所有的元组，不匹配WHERE子句的元组被跳过；第一步需要从存储读入数据，引发I/O操作。

2) 对于每一行，在缓冲区中存储一对值（对值，包括排序关键字和元组指针）。缓冲区的大小是系统变量的sort_buffer_size设定的值。

3) 当缓冲区已满，运行快排算法（快速排序，qsort）对一个块中的数据进行排序，将结果存储在一个临时文件。保存一个指向排序后的块的指针（如果第二步所说的对值都能被缓冲区容纳，则不会创建临时文件）。

4) 重复上述步骤，直到所有的行已经被读取。

5) 执行一个多路归并操作（操作对象是第三步生成的每一个有序的块）汇集到“MERGEBUFF域”，然后存放到在第二个临时文件中。重复操作，直到第一个文件的所有块归并后存入到第二个文件；“MERGEBUFF域”是代码sql_sort.h中定义的宏，值为7。

6) 重复以下操作（第7步和第8步），直到留下少于“MERGEBUFF2域”标明的块数为止；“MERGEBUFF2域”是代码sql_sort.h中定义的宏，值为15。

7) 在最后一次多路归并操作中，把元组的指针（排序关键字的最后部分）写入到一个结果文件。

8) 在结果文件中，按照排列的顺序使用元组指针读取元组（为了优化这项操作，MySQL读入元组指针进入一个大的块，对块中元组指针进行排序而不是直接对数据排序，然后再用有序的元组指针获取元组到元组缓存，元组缓冲区的大小由read_rnd_buffer_size参数控制）。第8步需要从存储读入数据，引发I/O操作。

算法二：单路排序算法

除利用ORDERBY子句中包括的列对象外，还利用查询目标列中的所有列对象进行排序（适用于除BLOB、TEXT类型外的所有的其他类型的排序）

MySQL4.1之后出现的改进算法，减少一次I/O，需要增加缓冲区大小容纳更多信息。其具体实现过程如下：

1) 获取与WHERE子句匹配的元组。这一步需要从存储读入数据，引发I/O操作。

2) 对于每一个元组，记录排序键值、行的位置值、查询所需的列。这一步记录更多内容，需要更大缓存，内存存储一条元组的信息的长度比算法一的“对值”大许多，这可能引发排序速度问题（排序对象的长度变长，但是内存有限，所以就需把一次内存排序变为多次，进而影响排序的速度），为了控制这个问题，MySQL引入一个参数“max_length_for_sort_data”，如果这一步得到的元组长度大于这个值，则不使用算法二。需要MySQL的使用者特别注意的是，在排序中，如果存在“很高磁盘I/O和很低的CPU利用率”的现象，则需要考虑调整“max_length_for_sort_data”的大小以变更换排序算法。

3) 按照排序的键值，对元组（元组是第二步的结果）进行排序。

算法二直接从缓冲区中的排序的元组中获取有序的列信息等（查询的目的对象），而不是第二次访问该表读取所需的列。相比算法一减少一次I/O。

FileSort优化策略

当无法使用索引列排序时，为了提高Order By的速度，应该尝试一下优化：
1、避免使用 “select * ” 。查询的字段越多导致元组长度总合可能

超过max_length_for_sort_data的设置，导致无法使用单路排序算法，只能用双路排序算法。
超过sort_buffer_size的设置，超出后会创建tmp文件进行合并，导致多次IO
2、适当增大sort_buffer_size参数的设置

3、适当增大max_length_for_sort_data参数的设置

group by 示例

示例：

group by 总结

group by与order by的索引优化基本一样，group by实质是先排序后分组，也就是分组之前必排序，遵照索引的最佳左前缀原则可以大大提高group by的效率。

当无法使用索引列排序时，适当增大sort_buffer_size参数 + 适当增大max_length_for_sort_data参数可以提高filesort排序的效率。注意：可能会出现Using temporary，也就是说mysql在对查询结果排序时使用了临时表。

where高于having，能写在where限定条件中的就尽量写在where中。
---------------------
作者：走慢一点点
来源：CSDN
原文：https://blog.csdn.net/wuseyukui/article/details/72627667
版权声明：本文为博主原创文章，转载请附上博文链接！

MySQL高级之 order by、group by 优化

标签：log bsp 调整变量原创实现排序作者步骤

本文系统来源：https://www.cnblogs.com/maohuidong/p/10983096.html

内容总结

以上是互联网集市为您收集整理的MySQL高级之 order by、group by 优化全部内容，希望文章能够帮你解决MySQL高级之 order by、group by 优化所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/508067.html

来源：【匿名】

【上一篇】REPAIR修复mysql报错is marked as crashed and should be 【下一篇】用IE远程创建Mysql数据库的简易程序

更多 ►

【MySQL高级之 order by、group by 优化】教程文章相关的互联网学习教程文章

php-MySQL一起使用ORDER BY和GROUP BY【代码】

这个问题已经在这里有了答案： > Select first row in each GROUP BY group? 14个我有一张产品编号为ID等类别的产品的表…我正在尝试从每个item_category中提取1个项目,这是最新的(其类别中ID最高). 这是代码,它使我从6个类别中获得6个项目,但它们是最旧的(ID最小)SELECT * from items WHERE item_category = '2' or item_category = '4' or item_category = '12' or i...

mysql概要（四）order by，group 的特点，子查询【图】

2.limit 在语句最好，截取记录的条数。一般和order by 配合使用 limit[offset][N] offset: 偏移量 N：条数；如limit(2,2),即从第三记录开始取两条记录。当一个参数时：limit 2,即从第一条记录开始取2条 3关于分组和聚合函数的一个问题，当分组时会从库中取组第一次出现时对应数据作为组数据，而使用聚合函数时候，聚合函数参数对应的列值和该组并不是对应的。只是组合一起如：以班级进行分组，获取成绩最好的学生，s...

Mysql 下 Insert、Update、Delete、Order By、Group By注入【代码】

Insert: 语法：INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....) 报错注入： insert into test(id,name,pass) values (6,‘xiaozi‘ or updatexml(1,concat(0x7e,(database()),0x7e),0) or ‘‘, ‘Nervo‘); insert into test(id,name,pass) values (6,‘xiaozi‘ or extractvalue(1,concat(0x7e,database())) or ‘‘, ‘Nervo‘); 盲注： //根据or之间的表达式是否成立来进行盲注‘or 1=1 or ‘ //插入的测试语句...

mysql ORDER BY和 GROUP BY【代码】

今天把网站的mysq版本更新到最新版本了为5.7 在查询语句的时候出现了一个错误语句： ORDER BY clause is not in GROUP BY clause and contains nonaggregated column ‘g2yx_yy.u.login_time‘ which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by 这个语句的错误是 order by 的语句中没有依赖于group by语句中下面是我之前写的错误语句 ...

mysql ORDER BY,GROUP BY 和DISTINCT原理【代码】【图】

sky@localhost : example 09:48:41> EXPLAIN -> SELECT m.id,m.subject,c.content -> FROM group_message m,group_message_content c -> WHERE m.group_id = 1 AND m.id = c.group_msg_id -> ORDER BY m.user_id\G*************************** 1. row *************************** id: 1 select_type: SIMPLE table: m type: ref possible_keys: PRIMARY,idx_group_message_gid_uid key: idx_group_message_gid_uid key_len: 4 ref...

mysql 中order by 与group by的顺序

mysql 中order by 与group by的顺序是： select from where group by order by 注意：group by 比order by先执行，order by不会对group by 内部进行排序，如果group by后只有一条记录，那么order by 将无效。要查出group by中最大的或最小的某一字段使用 max或min函数。例： select sum(click_num) as totalnum,max(update_time) as update_time,count(*) as totalarticle from article_detail where userid =1 group by use...

Mysql5.7中子查询时order by与group by合用无效的解决办法【图】

Windows10 专业版64位 MySQL5.7.20《2015年辛星mysql教程第一本基础操作》 P65 原文：实践内容：上面的SQL语句没有得到相应的结果。不能用于查询每个部门最高薪的成员。尝试分别执行order by和group by查询似乎order by子查询得到的表中的数据并没有在外部查询中起作用。查询了相关group by和order by的执行顺序，也没有得到相应的结果。猜想：是不是因为因为用的5.7的mysql，和之前的出入比较大。后来终于被我查到了...