首页 / HBASE / HBase一次慢查询请求的问题排查与解决过程

HBase一次慢查询请求的问题排查与解决过程

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了HBase一次慢查询请求的问题排查与解决过程，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2054字，纯文字阅读大概需要3分钟。

内容图文

作者: 大圆那些事 | 文章可以转载，请以超链接形式标明文章原始出处和作者信息

网址: http://www.cnblogs.com/panfeng412/archive/2013/06/08/hbase-slow-query-troubleshooting.html

最近HBase集群遇到过一次慢查询请求的问题，下面是对这一问题的具体描述及排查解决过程。

1. 发现问题

项目中有一张HBase表，每天凌晨以后会集中批量导入一批数据，导入数据量很大，在千万到亿的量级，然后白天为用户提供查询服务。某天突然发现，该表按照各个region（共计256个）分别仅scan少数几条数据时，部分region的查询请求的响应时间很慢，长达10秒甚至几十秒不等。

2. 排查问题

首先，通过查看HBase自带的region server监控界面上，看到这张表的每个region下面只有1~3个StoreFile，排除了由于StoreFile过多导致查询响应慢的情况。

接着排查，发现这张表的TTL为5天，因此会有大量过期数据存在。同时，由于这张表每天早上会导入一批数据（其中上周3.22那天集中导入了7亿多条记录），而集群的major compact周期配置是7天，虽然到今天为止3.22号的数据已经过期了，但是还没有经过major compact触发清除过期的数据，因此，存在大量过期但尚未被清除的数据，导致即使按照各个region分别仅scan少数几条数据，仍需要过滤掉一大批过期的数据（从监控看到当时的Block Cache访问量比平时高了一倍左右，如下图所示），才能扫到实际有用的数据，所以查询响应时间很慢。

HBase一次慢查询请求的问题排查与解决过程 - 文章图片

3. 解决问题

针对这一问题，有以下两种解决方法：

1）每天早上导入数据后，强制触发一次major compact操作（见HBaseAdmin的majorCompct方法，异步执行），使得表中每个region中的过期数据可以被及时清除掉。

2）由于集群的major compact周期为7天，而表的TTL为5天，因此可以将major compact周期调小（配置参数为hbase.hregion.majorcompaction，单位为毫秒；同时，hbase.offpeak.start.hour可以设置major compact启动的小时，例如，设置为1，可保证在1点后触发），从集群级别保证major compact尽早触发执行。

本文链接

HBase一次慢查询请求的问题排查与解决过程 - 文章图片

原文地址：HBase一次慢查询请求的问题排查与解决过程, 感谢原作者分享。

内容总结

以上是互联网集市为您收集整理的HBase一次慢查询请求的问题排查与解决过程全部内容，希望文章能够帮你解决HBase一次慢查询请求的问题排查与解决过程所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/556675.html

来源：【匿名】

【上一篇】HBase新特性—StripeCompaction 【下一篇】基于HBase Thrift接口的一些使用问题及相关注意事项的详解

更多 ►

【HBase一次慢查询请求的问题排查与解决过程】教程文章相关的互联网学习教程文章

后端接口访问数据查询如何提高性能？从MySQL、ES、HBASE等技术出发解决慢查询！...【代码】

1. MySQL查询慢是什么体验？谢邀，利益相关。大多数互联网应用场景都是读多写少，业务逻辑更多分布在写上。对读的要求大概就是要快。那么都有什么原因会导致我们完成一次出色的慢查询呢？1.1 索引在数据量不是很大时，大多慢查询可以用索引解决，大多慢查询也因为索引不合理而产生。MySQL 索引基于 B+ 树，这句话相信面试都背烂了，接着就可以问最左前缀索引、 B+ 树和各种树了。说到最左前缀，实际就是组合索引的使用规则，使用合...