首页 / 大数据 / mysql大数据量之limit优化

mysql大数据量之limit优化

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了mysql大数据量之limit优化，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5659字，纯文字阅读大概需要9分钟。

内容图文

背景：当数据库里面的数据达到几百万条上千万条的时候，如果要分页的时候（不过一般分页不会有这么多），如果业务要求这么做那我们需要如何解决呢？
我用的本地一个自己生产的一张表有五百多万的表，来进行测试，表名为big_data;
首先我们看如下几条sql语句：
在这之前我们开启profiling来监测sql语句执行的情况。
set profiling=1;
1.查询从第10w条数据开始分页10条
2.查询从第20w条数据分页10条
3.查询从第30w条数据分页10条

3.查询从第300w条数据分页10条

3.查询从第500w条数据分页10条

我们可以看出查询从200w开始分页的都还比较快，但从500w开始速度就变的很慢了，这个是不太让人满意的。

mysql> select id,my_name from big_data limit 5000000,10;

+---------+------------+

| id | my_name |

+---------+------------+

| 5000001 | kwCwziqhNu |

| 5000002 | NLpqMMwaJv |

| 5000003 | kskUTLXDbx |

| 5000004 | PtAvBtpubZ |

| 5000005 | whsuShiuvX |

| 5000006 | TcDLWzHNQT |

| 5000007 | qHmnEkjsmh |

| 5000008 | UQrmluqvgr |

| 5000009 | UzKeqpEbtQ |

| 5000010 | SkuvSePMpq |

+---------+------------+

10 rows in set (2.34 sec)

mysql> show profiles;

+----------+------------+--------------------------------------------------+

| Query_ID | Duration | Query |

+----------+------------+--------------------------------------------------+

| 1 | 0.02591075 | select id,my_name from big_data limit 100000,10 |

| 2 | 0.05773150 | select id,my_name from big_data limit 200000,10 |

| 3 | 0.08253525 | select id,my_name from big_data limit 300000,10 |

| 4 | 1.38455375 | select id,my_name from big_data limit 3000000,10 |

| 5 | 2.34040775 | select id,my_name from big_data limit 5000000,10 |

+----------+------------+--------------------------------------------------+

5 rows in set, 1 warning (0.00 sec)

show profiles；

我们就如下两种解决方法：
（1）、通过判断id的范围来分页
select id,my_sn from big_data where id>5000000 limit 10;
也得到了分页的数据，但是我们发现如果id不是顺序的，也就是如果有数据删除过的话，那么这样分页数据就会不正确，这个是有缺陷的。
（2）、通过连接查询来分页
我们可以先查询500w条数据开始分页的那10个id，然后通过连接查询显示数据
mysql> select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 4500000,10) as tmp on tmp.id=b.id;

我们测试不同起始端的分页数据

mysql> select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 5000000,10) as tmp on tmp.id=b.id;

+---------+------------+

| id | my_name |

+---------+------------+

| 5000001 | kwCwziqhNu |

| 5000002 | NLpqMMwaJv |

| 5000003 | kskUTLXDbx |

| 5000004 | PtAvBtpubZ |

| 5000005 | whsuShiuvX |

| 5000006 | TcDLWzHNQT |

| 5000007 | qHmnEkjsmh |

| 5000008 | UQrmluqvgr |

| 5000009 | UzKeqpEbtQ |

| 5000010 | SkuvSePMpq |

+---------+------------+

10 rows in set (2.15 sec)

mysql> show profiles;

+----------+------------+------------------------------------------------------------------------------------------------------------------------------------+

| Query_ID | Duration | Query |

+----------+------------+------------------------------------------------------------------------------------------------------------------------------------+

| 1 | 0.02591075 | select id,my_name from big_data limit 100000,10 |

| 2 | 0.05773150 | select id,my_name from big_data limit 200000,10 |

| 3 | 0.08253525 | select id,my_name from big_data limit 300000,10 |

| 4 | 1.38455375 | select id,my_name from big_data limit 3000000,10 |

| 5 | 2.34040775 | select id,my_name from big_data limit 5000000,10 |

| 6 | 0.00004200 | reset query cache |

| 7 | 0.01999275 | select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 100000,10) as tmp on tmp.id=b.id |

| 8 | 0.03888825 | select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 200000,10) as tmp on tmp.id=b.id |

| 9 | 0.37394450 | select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 1000000,10) as tmp on tmp.id=b.id |

| 10 | 1.33475700 | select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 3000000,10) as tmp on tmp.id=b.id |

| 11 | 2.14759000 | select b.id,b.my_name from big_data as b inner join (select id from big_data order by id limit 5000000,10) as tmp on tmp.id=b.id |

如果怀疑有缓存的缘故我们可以清楚缓存后来查询

reset query cache;

?
show profile for query 3;//查看被记录的第三条sql语句的执行情况
可以看出两种方法查出来的数据都是一致的，但通过方法二的速度比之前单表查询的速度快了一些。

分析：因为mysql分页查询是先把分页之前数据都查询出来了，然后截取后把不是分页的数据给扔掉后得到的结果这样，所以数据量太大了后分页缓慢是可以理解的。
但是我们可以先把需要分页的id查询出来，因为id是主键id主键索引，查询起来还是快很多的，然后根据id连接查询对应的分页数据，可见并不是所有的连接查询都会比
单查询要慢，要依情况而定。

mysql大数据量之limit优化

标签：

本文系统来源：http://www.cnblogs.com/lisqiong/p/5635009.html

内容总结

以上是互联网集市为您收集整理的mysql大数据量之limit优化全部内容，希望文章能够帮你解决mysql大数据量之limit优化所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/466449.html

来源：【匿名】

【上一篇】三大数据库如何获取表中的第m条到第n条记录（n大于m）【下一篇】phpexcel导入大数据内存溢出的解决方法有哪些

更多 ►

【mysql大数据量之limit优化】教程文章相关的互联网学习教程文章

java使用poi实现大数据量导出为EXCEL【代码】

总体的实现思想为：每次查询出2w数据，并写入到临时文件然后把这些文件写入到一个EXCEL里边，或者把这些文件压缩为zip文件，然后把Zip文件提供给下载(这里使用zip打包是因为，在Linux上也能进行Zip打包)。//这个zip打包工具类 package net.szh.zip; import java.io.File; import org.apache.tools.ant.Project; import org.apache.tools.ant.taskdefs.Zip; import org.apache.tools.ant.types.FileSet; public ...

LVS解决高并发，大数据量【图】

http://www.360doc.com/content/14/0726/00/11962419_397102114.shtml LVS的全称Linux vitual system,是由目前阿里巴巴的著名工程师章文嵩博士开发的一款开源软件。LVS工作在一台server上提供Directory(负载均衡器)的功能，本身并不提供服务，只是把特定的请求转发给对应的realserver(真正提供服务的主机)，从而实现集群环境中的负载均衡。LVS的核心组件ipvs工作在kernel中，是真正的用于实现根据定义的集群转发规则把客户端的请求...

MySQL大数据量分页查询方法及其优化

---方法1: 直接使用数据库提供的SQL语句---语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N---适应场景: 适用于数据量较少的情况(元组百/千级)---原因/缺点: 全表扫描,速度会很慢且有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3). Limit限制的是从结果集的M位置处取出N条输出,其余抛弃. ---方法2: 建立主键或唯一索引, 利用索引(假设每页10条)---语句样式: MySQL中,可用如下方法: SELECT * ...

mysql 大数据量求平均值

需求是：对于一个设备，求一天内每个小时的平均值，一个月内每天的平均值，更通用的需求是，从起始时间到结束时间，每隔一段时间，求一个平均值。目前的解决策略是：在存储过程中进行处理，从起始时间到结束时间，切割成段，求出每一段的平均值，合并起来。存在问题：数据量很大的时候，会存在严重的性能问题。比如：一个月内每天的平均值，这个涉及的数据量将非常大，查询非常耗时。目前没有做过基准测试，具体的时间消耗还不确定...

什么报表工具对大数据量报表的支持最好？【图】

大量数据从数据库里全部查出来，然后再生成报表输出到 web 端，一般需要很长时间，用户体验很差，而且报表一般采用内存计算，全读入的话也容易爆掉内存。所以大数据量报表呈现时都是采用分页的方式，尽量快速呈现第一页，用户也可以随意翻页，每次显示的一页数据量比较小，也就不会内存溢出。大部分报表工具通常是使用数据库的分页机制。利用数据库提供的返回指定行号范围内记录的语法，即界面端根据当前页号计算出行号范围（每页显...

ElementUI 中控件 Select 大数据量渲染处理

问题：element UI 中 select 数据量太大，渲染太慢怎么处理？处理方式： <el-select v-model="ruleForm.animalOwnerId" filterable style="width:100%;" placeholder="请选择养殖户" clearable :filter-method="animalOwnerD"> <el-option v-for="item in ownerTop200" :key="item.value" :label="item.name" :value="item.value"></el-option> </el-select> methods：{ //ownerList 大数据量集合 //ownerTop...

tomcat优化---大数据量提交tomcat时，tomcat无法接收导致页面无反应

关于tomcat的一个优化问题：有时候保存大数据量的数据时，tomcat不优化的话，页面会没反应，tomcat后台并不报错，只是提示下面内容：警告: More than the maximum number of request parameters (GET plus POST) for a s ingle request ([10,000]) were detected. Any parameters beyond this limit have be en ignored. To change this limit, set the maxParameterCount attribute on the Con nector. 如果遇到此问题，就要进行...

DB开发之大数据量高并发的数据库优化【代码】

一、数据库结构的设计如果不能设计一个合理的数据库模型，不仅会增加客户端和服务器段程序的编程和维护的难度，而且将会影响系统实际运行的性能。所以，在一个系统开始实施之前，完备的数据库模型的设计是必须的。在一个系统分析、设计阶段，因为数据量较小，负荷较低。我们往往只注意到功能的实现，而很难注意到性能的薄弱之处，等到系统投入实际运行一段时间后，才发现系统的性能在降低，这时再来考虑提高系统性能则要花费更多的...

【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化（转载）

本文系统来源：http://blog.csdn.net/zwan0518/article/details/11972853

SSDB在大数据量日志分析中的应用案例【图】

在一个网站广告系统中, 需要针对每一个用户所接受的弹窗次数和点击次数这两个重要指标进行统计, 从而进行效果分析和精准投放的改进. 这两个指标的统计算法其实非常简单, 主要的难点在于大数据量. 广告系统的涉及的用户量达到数千万人, 每天的日志数据量是几在一个网站广告系统中, 需要针对每一个用户所接受的弹窗次数和点击次数这两个重要指标进行统计, 从而进行效果分析和精准投放的改进. 这两个指标的统计算法其实非常简单, 主要...

JQery jstree 大数据量问题解决方法

问题解决：生成的树是逐级加载的，在open函数中有一个生成节点的代码：代码代码如下:for (var i=0; i<data.length; i++) { var n = TREE_OBJ.create(data[i], $(NODE)); if (onaddnode) onaddnode(n); } var firstChild = TREE_OBJ.children(NODE)[0]; if ($(firstChild).attr(id)==-1) TREE_OBJ.remove(firstChild); 　　问题就出 TREE_OBJ.create函数上，这个函数很消耗性能。代码改成如下：代码代码如下:var children=""...

在大数据量下有什么分页方法？LIMIT效率不高

在大数据量下有什么分页方法？LIMIT效率不高回复内容：在大数据量下有什么分页方法？LIMIT效率不高$sql = "select *from user where id>{$id} limit 10";$id为上一页最大的值把数据缓存下来吧，或许应该考虑一下重构数据库结构了上sphinx ...不知道你用什么数据库，是否支持流模式返回数据（streaming）？数据量大的话，适合使用streaming模式，这样数据可以一边执行一边返回数据，不会将所有数据都缓存在内存里，从而减轻服务器压...

什么？你还在用POI导出数据？EasyExcel解决大数据量导出OOM(内存溢出)【代码】【图】

前言今天忙完，上面派发了一个任务，有个项目的导出接口数据量太大了，导出直接内存溢出(OOM)，暂时做法是限制导出的行数，然后让我去研究一下，通过一下午的研究，通过EasyExcel解决了这个问题，并且大幅度提高了映射速度，如下图： EasyExcel介绍 EasyExcel是一个基于Java的简单、省内存的读写Excel的开源项目,alibaba旗下的高性能处理Excel工具。在尽可能节约内存的情况下支持读写百M的Excel. Java解析、生成Excel比较常用的框...

针对Sqlserver大数据量插入速度慢或丢失数据的解决方法

我的设备上每秒将2000条数据插入数据库，2个设备总共4000条，当在程序里面直接用insert语句插入时，两个设备同时插入大概总共能插入约2800条左右，数据丢失约1200条左右，测试了很多方法，整理出了两种效果比较明显的解决办法：方法一：使用Sql Server函数:1.将数据组合成字串，使用函数将数据插入内存表，后将内存表数据复制到要插入的表。2.组合成的字符换格式：111|222|333|456,7894,7458|0|1|2014-01-01 12:15:16;1111|2222|33...

关于THINKPHP的addAll支持的最大数据量

Thinkphp中的Model操作有两个方法:add()和addAll<spanMicrosoft YaHei; font-size: 14px;">1 $User = M("User"); // 实例化User对象 2 $data[name] = ThinkPHP; 3 $data[email] = ThinkPHP@gmail.com; 4 $User->add($data); 5 6 $dataList[] = array(name=>thinkphp,email=>thinkphp@gamil.com); 7 $dataList[] = array(name=>onethink,email=>onethink@gamil.com); 8 $User->addAll($dataList);<spanMicrosoft YaHei; line-heigh...

大数据 - 最热教程

python处理大数据你选什么工具? pandas...冲着这份大数据分析案例，我立马下载该...06-大数据性能优化- 长列表优化 /Objec...大数据学习总结（2021版）---shell windows下大数据开发环境搭建（1）——...Python：如何在未排序的列表中查找大于...Python如何处理大数据？3个技巧效率提升...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...spring boot集成mongodb 分片解决大数据...

首页 / 大数据 / mysql大数据量之limit优化

mysql大数据量之limit优化

内容导读

内容图文

内容总结

内容备注

内容手机端

【mysql大数据量之limit优化】教程文章相关的互联网学习教程文章

java使用poi实现大数据量导出为EXCEL【代码】

LVS解决高并发，大数据量【图】

MySQL大数据量分页查询方法及其优化

mysql 大数据量求平均值

什么报表工具对大数据量报表的支持最好？【图】

ElementUI 中控件 Select 大数据量渲染处理

tomcat优化---大数据量提交tomcat时，tomcat无法接收导致页面无反应

DB开发之大数据量高并发的数据库优化【代码】

【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化（转载）

SSDB在大数据量日志分析中的应用案例【图】

JQery jstree 大数据量问题解决方法

在大数据量下有什么分页方法？LIMIT效率不高

什么？你还在用POI导出数据？EasyExcel解决大数据量导出OOM(内存溢出)【代码】【图】

针对Sqlserver大数据量插入速度慢或丢失数据的解决方法

关于THINKPHP的addAll支持的最大数据量

MYSQL - 相关标签

大数据 - 相关标签

大数据 - 最新教程

大数据 - 最热教程