ELK构建MySQL慢日志收集平台详解

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了ELK构建MySQL慢日志收集平台详解，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含8125字，纯文字阅读大概需要12分钟。

内容图文

转载自：https://mp.weixin.qq.com/s/umH7ImZZVhdfgMdZ3Hz5fA

ELK介绍

ELK最早是Elasticsearch（以下简称ES）、Logstash、Kibana三款开源软件的简称，三款软件后来被同一公司收购，并加入了Xpark、Beats等组件，改名为Elastic Stack，成为现在最流行的开源日志解决方案，虽然有了新名字但大家依然喜欢叫她ELK，现在所说的ELK就指的是基于这些开源软件构建的日志系统。

我们收集mysql慢日志的方案如下：

ELK构建MySQL慢日志收集平台详解 - 文章图片

mysql服务器安装Filebeat作为agent收集slowLog
Filebeat读取mysql慢日志文件做简单过滤传给Kafka集群
Logstash读取Kafka集群数据并按字段拆分后转成JSON格式存入ES集群
Kibana读取ES集群数据展示到web页面上

慢日志分类

目前主要使用的mysql版本有5.5、5.6和5.7，经过仔细对比发现每个版本的慢查询日志都稍有不同，如下：

5.5版本慢查询日志

#?Time:?180810??8:45:12
#?User@Host:?select[select]?@??[10.63.253.59]
#?Query_time:?1.064555??Lock_time:?0.000054?Rows_sent:?1??Rows_examined:?319707
SET?timestamp=1533861912;
SELECT?COUNT(*)?FROM?hs_forum_thread?t??WHERE?t.`fid`='50'?AND?t.`displayorder`>='0';

5.6版本慢查询日志

#?Time:?160928?18:36:08
#?User@Host:?root[root]?@?localhost?[]??Id:??4922
#?Query_time:?5.207662??Lock_time:?0.000085?Rows_sent:?1??Rows_examined:?526068
use?db_name;
SET?timestamp=1475058968;
select?count(*)?from?redeem_item_consume?where?id<=526083;

5.7版本慢查询日志

#?Time:?2018-07-09T10:04:14.666231Z
#?User@Host:?bbs_code[bbs_code]?@??[10.82.9.220]??Id:?9304381
#?Query_time:?5.274805??Lock_time:?0.000052?Rows_sent:?0??Rows_examined:?2
SET?timestamp=1531130654;
SELECT?*?FROM?pre_common_session?WHERE??sid='Ba1cSC'??OR?lastactivity<1531129749;

慢查询日志异同点：

每个版本的Time字段格式都不一样
相较于5.6、5.7版本，5.5版本少了Id字段
use db语句不是每条慢日志都有的
可能会出现像下边这样的情况，慢查询块# Time：下可能跟了多个慢查询语句

#?Time:?160918??2:00:03
#?User@Host:?dba_monitor[dba_monitor]?@??[10.63.144.82]??Id:???968
#?Query_time:?0.007479??Lock_time:?0.000181?Rows_sent:?172??Rows_examined:?344
SET?timestamp=1474135203;
SELECT?table_schema?as?'DB',table_name?as?'TABLE',CONCAT(ROUND((?data_length?+?index_length?)?/?(?1024?*?1024?*1024?),?2),?'')?as?'TOTAL',TABLE_COMMENT??FROM?information_schema.TABLES?ORDER?BY?data_length?+?index_length?DESC;
#?User@Host:?dba_monitor[dba_monitor]?@??[10.63.144.82]??Id:???969
#?Query_time:?0.003303??Lock_time:?0.000395?Rows_sent:?233??Rows_examined:?233
SET?timestamp=1474135203;
select?TABLE_SCHEMA,TABLE_NAME,COLUMN_NAME,ORDINAL_POSITION,COLUMN_TYPE,ifnull(COLUMN_COMMENT,0)?from?COLUMNS?where?table_schema?not?in?('mysql','information_schema','performance_schema','test');

处理思路

上边我们已经分析了各个版本慢查询语句的构成，接下来我们就要开始收集这些数据了，究竟应该怎么收集呢？

拼装日志行：mysql的慢查询日志多行构成了一条完整的日志，日志收集时要把这些行拼装成一条日志传输与存储。
Time行处理：# Time:开头的行可能不存在，且我们可以通过SET timestamp这个值来确定SQL执行时间，所以选择过滤丢弃Time行
一条完整的日志：最终将以# User@Host:开始的行，和以SQL语句结尾的行合并为一条完整的慢日志语句
确定SQL对应的DB：use db这一行不是所有慢日志SQL都存在的，所以不能通过这个来确定SQL对应的DB，慢日志中也没有字段记录DB，所以这里建议为DB创建账号时添加db name标识，例如我们的账号命名方式为：projectName_dbName，这样看到账号名就知道是哪个DB了
确定SQL对应的主机：我想通过日志知道这条SQL对应的是哪台数据库服务器怎么办？慢日志中同样没有字段记录主机，可以通过filebeat注入字段来解决，例如我们给filebeat的name字段设置为服务器IP，这样最终通过beat.name这个字段就可以确定SQL对应的主机了

Filebeat配置

filebeat完整的配置文件如下：

filebeat.prospectors:

-?input_type:?log
??paths:
????-?/home/opt/data/slow/mysql_slow.log

??exclude_lines:?['^\#?Time']

??multiline.pattern:?'^\#?Time|^\#?User'
??multiline.negate:?true
??multiline.match:?after

??tail_files:?true

name:?10.82.9.89

output.kafka:
??hosts:?["10.82.9.202:9092","10.82.9.203:9092","10.82.9.204:9092"]
??topic:?mysql_slowlog_v2

重要参数解释：

input_type：指定输入的类型是log或者是stdin
paths：慢日志路径，支持正则比如/data/*.log
exclude_lines：过滤掉# Time开头的行
multiline.pattern：匹配多行时指定正则表达式，这里匹配以# Time或者# User开头的行，Time行要先匹配再过滤
multiline.negate：定义上边pattern匹配到的行是否用于多行合并，也就是定义是不是作为日志的一部分
multiline.match：定义如何将皮排行组合成时间，在之前或者之后
tail_files：定义是从文件开头读取日志还是结尾，这里定义为true，从现在开始收集，之前已存在的不管
name：设置filebeat的名字，如果为空则为服务器的主机名，这里我们定义为服务器IP
output.kafka：配置要接收日志的kafka集群地址可topic名称

Kafka接收到的日志格式：

{"@timestamp":"2018-08-07T09:36:00.140Z","beat":{"hostname":"db-7eb166d3","name":"10.63.144.71","version":"5.4.0"},"input_type":"log","message":"#?User@Host:?select[select]?@??[10.63.144.16]??Id:?23460596\n#?Query_time:?0.155956??Lock_time:?0.000079?Rows_sent:?112??Rows_examined:?366458\nSET?timestamp=1533634557;\nSELECT?DISTINCT(uid)?FROM?common_member?WHERE?hideforum=-1?AND?uid?!=?0;","offset":1753219021,"source":"/data/slow/mysql_slow.log","type":"log"}

Logstash配置

logstash完整的配置文件如下：

input?{
????kafka?{
????????bootstrap_servers?=>?"10.82.9.202:9092,10.82.9.203:9092,10.82.9.204:9092"
????????topics?=>?["mysql_slowlog_v2"]
????}
}

filter?{
????json?{
????????source?=>?"message"
????}

????grok?{
????????#?有ID有use
????????match?=>?[?"message",?"(?m)^#?User@Host:?%{USER:user}\[[^\]]+\]?@?(?:(?<clienthost>\S*)?)?\[(?:%{IP:clientip})?\]\s+Id:\s%{NUMBER:id:int}\n#?Query_time:?%{NUMBER:query_time:float}\s+Lock_time:?%{NUMBER:lock_time:float}\s+Rows_sent:?%{NUMBER:rows_sent:int}\s+Rows_examined:?%{NUMBER:rows_examined:int}\nuse\s(?<dbname>\w+);\nSET\s+timestamp=%{NUMBER:timestamp_mysql:int};\n(?<query>.*)"?]

????????#?有ID无use
????????match?=>?[?"message",?"(?m)^#?User@Host:?%{USER:user}\[[^\]]+\]?@?(?:(?<clienthost>\S*)?)?\[(?:%{IP:clientip})?\]\s+Id:\s%{NUMBER:id:int}\n#?Query_time:?%{NUMBER:query_time:float}\s+Lock_time:?%{NUMBER:lock_time:float}\s+Rows_sent:?%{NUMBER:rows_sent:int}\s+Rows_examined:?%{NUMBER:rows_examined:int}\nSET\s+timestamp=%{NUMBER:timestamp_mysql:int};\n(?<query>.*)"?]

????????#?无ID有use
????????match?=>?[?"message",?"(?m)^#?User@Host:?%{USER:user}\[[^\]]+\]?@?(?:(?<clienthost>\S*)?)?\[(?:%{IP:clientip})?\]\n#?Query_time:?%{NUMBER:query_time:float}\s+Lock_time:?%{NUMBER:lock_time:float}\s+Rows_sent:?%{NUMBER:rows_sent:int}\s+Rows_examined:?%{NUMBER:rows_examined:int}\nuse\s(?<dbname>\w+);\nSET\s+timestamp=%{NUMBER:timestamp_mysql:int};\n(?<query>.*)"?]

????????#?无ID无use
????????match?=>?[?"message",?"(?m)^#?User@Host:?%{USER:user}\[[^\]]+\]?@?(?:(?<clienthost>\S*)?)?\[(?:%{IP:clientip})?\]\n#?Query_time:?%{NUMBER:query_time:float}\s+Lock_time:?%{NUMBER:lock_time:float}\s+Rows_sent:?%{NUMBER:rows_sent:int}\s+Rows_examined:?%{NUMBER:rows_examined:int}\nSET\s+timestamp=%{NUMBER:timestamp_mysql:int};\n(?<query>.*)"?]
????}

????date?{
????????match?=>?["timestamp_mysql","UNIX"]
????????target?=>?"@timestamp"
????}

}

output?{
????elasticsearch?{
????????hosts?=>?["10.82.9.208:9200","10.82.9.217:9200"]
????????index?=>?"mysql-slowlog-%{+YYYY.MM.dd}"
????}
}

重要参数解释：

input：配置kafka的集群地址和topic名字
filter：过滤日志文件，主要是对message信息（看前文kafka接收到的日志格式）进行拆分，拆分成一个一个易读的字段，例如User、Host、Query_time、Lock_time、timestamp等。grok段根据我们前文对mysql慢日志的分类分别写不通的正则表达式去匹配，当有多条正则表达式存在时，logstash会从上到下依次匹配，匹配到一条后边的则不再匹配。date字段定义了让SQL中的timestamp_mysql字段作为这条日志的时间字段，kibana上看到的实践排序的数据依赖的就是这个时间
output：配置ES服务器集群的地址和index，index自动按天分割

kibana查询展示

打开Kibana添加mysql-slowlog-*的Index，并选择timestamp，创建Index Pattern
进入Discover页面，可以很直观的看到各个时间点慢日志的数量变化，可以根据左侧Field实现简单过滤，搜索框也方便搜索慢日志，例如我要找查询时间大于2s的慢日志，直接在搜索框输入query_time: > 2回车即可
点击每一条日志起边的很色箭头能查看具体某一条日志的详情
如果你想做个大盘统计慢日志的整体情况，例如top 10 SQL等，也可以很方便的通过web界面配置

总结

不要望而却步，当你开始去做已经成功一半了
本篇文章详细介绍了关于mysql慢日志的收集，收集之后的处理呢？我们目前是DBA每天花时间去Kibana上查看分析，有优化的空间就跟开发一起沟通优化，后边达成默契之后考虑做成自动报警或处理
关于报警ELK生态的xpark已经提供，且最新版本也开源了，感兴趣的可以先研究起来，欢迎一起交流

内容总结

以上是互联网集市为您收集整理的ELK构建MySQL慢日志收集平台详解全部内容，希望文章能够帮你解决ELK构建MySQL慢日志收集平台详解所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/911950.html

来源：【匿名】

【上一篇】Mysql 通过binlog日志恢复数据【下一篇】php错误日志怎么看

更多 ►

【ELK构建MySQL慢日志收集平台详解】教程文章相关的互联网学习教程文章

一、Log4j简介Log4j有三个主要的组件：Loggers(记录器)，Appenders (输出源)和Layouts(布局)。这里可简单理解为日志类别，日志要输出的地方和日志以何种形式输出。综合使用这三个组件可以轻松地记录信息的类型和级别，并可以在运行时控制日志输出的样式和位置。1、LoggersLoggers组件在此系统中被分为五个级别：DEBUG、INFO、WARN、ERROR和FATAL。这五个级别是有顺序的，DEBUG < INFO < WARN < ERROR < FATAL，分别用来指定这条日志...

Log4J日志配置详解【代码】

Nginx内置变量以及日志格式变量参数详解【代码】

$args #请求中的参数值 $query_string #同 $args $arg_NAME #GET请求中NAME的值 $is_args #如果请求中有参数，值为"?"，否则为空字符串 $uri #请求中的当前URI(不带请求参数，参数位于$args)，可以不同于浏览器传递的$request_uri的值，它可以通过内部重定向，或者使用index指令进行修改，$uri不包含主机名，如"/foo/bar.html"。 $document_uri...

windows安全日志分析工具logparser用法详解

logparser使用介绍首先，让我们来看一下Logparser架构图，熟悉这张图，对于我们理解和使用Logparser是大有裨益的简而言之就是我们的输入源(多种格式的日志源)经过 SQL语句(有SQL引擎处理)处理后，可以输出我们想要的格式。1、输入源从这里可以看出它的基本处理逻辑，首先是输入源是某一种固定的格式，比如EVT(事件)，Registry(注册表)等，对于每一种输入源，它所涵盖的字段值是固定的，可以使用logparser –h –i:EVT查出(这里以EV...

日志组件slf4j介绍及配置详解【代码】

1 基本介绍每一个Java程序员都知道日志对于任何一个Java应用程序，尤其是服务端程序是至关重要的，而很多程序员也已经熟悉各种不同的日志库如java.util.logging、Apache log4j、logback。但如果你还不知道SLF4J（Simple logging facade for Java）的话，那么是时候去在你项目中学习使用SLF4J了。SLF4J不同于其他日志类库，与其它日志类库有很大的不同。SLF4J(Simple logging Facade for Java)不是一个真正的日志实现，而是一个抽象...

ELK 日志分析系统详解【图】

大纲：一、简介二、Logstash三、Redis四、Elasticsearch五、Kinaba一、简介1、核心组成ELK由Elasticsearch、Logstash和Kibana三部分组件组成；Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，它可以对你的日志进行收集、分析，并将其存储供以后使用kibana 是一个开源和免费的工具，它可以为...

《Tomcat日志系统详解》

综合：Tomcat下相关的日志文件 Cataline引擎的日志文件，文件名catalina.日期.log Tomcat下内部代码丢出的日志，文件名localhost.日期.log（jsp页面内部错误的异常，org.apache.jasper.runtime.HttpJspBase.service类丢出的，日志信息就在该文件！） Tomcat下默认manager应用日志，文件名manager.日期.log 控制台输出的日志，Linux下默认重定向到catalina.out Access日志（Servlet.xml配置）应用程序通过log4j.properties：${cata...

Linux下各种后门和日志工具详解

攻入Linux系统后，很多入侵者往往就开始得意忘形了。这其中还有一个原因，就是技术性也要求更高了。下面，我们来看看一些常用的经典工具。　　1、从这里延伸：后门和连接工具　　（1）Httptunnel　　Tunnel的意思是隧道，通常HTTPTunnel被称之为HTTP暗道，它的原理就是将数据伪装成HTTP的数据形式来穿过防火墙，实际上，它是在HTTP请求中创建了一个双向的虚拟数据连接来穿透防火墙。说得简单点，就是说在防火墙两边都设立一个转换程...

Nginx日志按日期切割详解【代码】

由于nginx的日志本身只是支持按照server_name或者大小进行划分，对于习惯了apache的按照一个网站每天一个日志的我来说是不可以接受的，所以就实现了按天切割的功能，这篇文章主要介绍了关于Nginx日志按日期切割的相关资料，需要的朋友可以参考下。实现需求本文实现的功能是在吗每天凌晨00:00把前一天的Nginx日志access.log重命名为access-xxxx-xx-xx.log格式，例如：access-2016-10-01.log，下面话不多说了，来看看详细的实现方法吧...

【java-日志组件】slf4j+logback配置及详解【代码】

文本主要介绍一下slf4j+logback在java工程中的配置，面向的读者是已经对slf4j+logback有一定了解的同学，不了解的同学，请看文章末尾的相关链接。以后会写一篇介绍slf4j框架的文章，其中会说明logback与之的关系。下面咱们进入正题。一、基于maven的slf4j+logback pom.xml配置<dependency><groupId>org.slf4j</groupId><artifactId>slf4j-api</artifactId><version>1.7.10</version></dependency><dependency><groupId>ch.qos.logb...

Linux下开源实时日志分析elk部署详解【代码】【图】

前言：Elk主要就是3个软件的组合，主要是elasticsearch搜索引擎，Logstash是一个日志收集日志，kibana实时分析进行展示。[关于日志搜集的软件，如:scribe,flume,heka,logstash,chukwa,fluentd,当然rsyslog rsyslog-ng都可以搜集。关于日志手机后存储软件，如:HDFS,Cassandra mongodb, redis,elasticsearch。关于日志分析软件比如要用HDFS就可以写mapreduce分析，如果需要实时分析就是用Kibana进行展示。]112.74.76.115 #安装logst...

centos 7.3搭建ELK日志分析系统详解【代码】【图】

一、前言：日志分析是我们运维解决系统故障、发现问题的主要手段。为了可以集中管理多台服务器的日志记录，开源实时日志分析ELK平台应用而生，ELK由Elasticsearch、Logstash和Kibana三个开源工具组成，这三个工具可以分别部署在不同的服务器上，并且相互关联，不过需要收集哪台服务器的日志，就必须在该服务器上部署Logstash。ELK的官网是：Elastic官网ELK的工作原理如下（懂得其中原理，才可部署一个高可用的ELK平台）：Logstash...

golang第三方日志包seelog配置文件详解

开发任何项目，都离不开日志，配好自己的项目日志输出，往往是开发项目的前提。在golang中，seelog应该是比较有名的日志处理包了，功能非常强大，seelog官方文档一、seelog主要功能下面我们看看seelog有啥强大设置不同级别的日志；输出到终端或文件；过滤指定级别日志；定义多种不同的日志输出格式；根据触发日志的文件名或者函数名来区别输出日志；通过 SMTP 或 TCP 转发日志(网络转发日志)；滚动日志文件(过期日志自动清除)。二、...

MySQL日志功能详解查询、慢查询【代码】

MySQL日志功能详解查询、慢查询MySQL日志：大量的IO操作不建议写到文件中mysql> show global variables like ‘innodb%‘; mysql> show global variables like ‘%log%‘; general_log | OFF log | OFF【临时开启记录日志】 mysql> set global log=‘ON‘; mysql> set global general_log=‘ON‘; Query OK, 0 rows affected, 1 warning (0.08 sec) general_...

Linux服务器access_log日志分析及配置详解（一）

nginx的log日志分为access log 和 error log 其中access log 记录了哪些用户，哪些页面以及用户浏览器、ip和其他的访问信息 error log 则是记录服务器错误日志错误日志的形式如下：12201.158.69.116 - - [03/Jan/2013:21:17:20 -0600] fwf[-] tip[-] 127.0.0.1:9000 0.007 0.007 MX pythontab.com GET /html/test.html HTTP/1.1 "200" 2426 "http://a.com" "es-ES,es;q=0.8" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (K...

日志 - 相关标签

日志代码日志分类日志服务器日志格式日志管理日志级别日志系统

日志 - 最热教程

pt-query-digest解析MySQLBinlog日志文...详解Python中logging日志模块在多进程环...SQL Server 收缩日志清空删除大日志文...使用nginx访问服务器log日志 linux C中的多进程概念与log日志与部分...过滤nginx日志并添加防火墙拒绝访问 ce...mysql查看执行sql语句的记录日志 ssh登录日志收集 Filebeat收集单个日志&json格式 Oracle如何决定日志切换到剩下的那个日...

首页 / 日志 / ELK构建MySQL慢日志收集平台详解

ELK构建MySQL慢日志收集平台详解

内容导读

内容图文

ELK介绍

慢日志分类

处理思路

Filebeat配置

重要参数解释：

Kafka接收到的日志格式：

Logstash配置

重要参数解释：

kibana查询展示

总结

内容总结

内容备注

内容手机端

【ELK构建MySQL慢日志收集平台详解】教程文章相关的互联网学习教程文章

Log4J日志配置详解【代码】

Log4J日志配置详解【代码】

Nginx内置变量以及日志格式变量参数详解【代码】

windows安全日志分析工具logparser用法详解

日志组件slf4j介绍及配置详解【代码】

ELK 日志分析系统详解【图】

《Tomcat日志系统详解》

Linux下各种后门和日志工具详解

Nginx日志按日期切割详解【代码】

【java-日志组件】slf4j+logback配置及详解【代码】

Linux下开源实时日志分析elk部署详解【代码】【图】

centos 7.3搭建ELK日志分析系统详解【代码】【图】

golang第三方日志包seelog配置文件详解

MySQL日志功能详解查询、慢查询【代码】

Linux服务器access_log日志分析及配置详解（一）

MYSQL - 相关标签

日志 - 相关标签

日志 - 最新教程

日志 - 最热教程