首页 / MYSQL / 基于Canal和Kafka实现MySQL的Binlog近实时同步

基于Canal和Kafka实现MySQL的Binlog近实时同步

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了基于Canal和Kafka实现MySQL的Binlog近实时同步，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含15605字，纯文字阅读大概需要23分钟。

内容图文

前提

近段时间，业务系统架构基本完备，数据层面的建设比较薄弱，因为笔者目前工作重心在于搭建一个小型的数据平台。

优先级比较高的一个任务就是需要近实时同步业务系统的数据（包括保存、更新或者软删除）到一个另一个数据源，持久化之前需要清洗数据并且构建一个相对合理的便于后续业务数据统计、标签系统构建等扩展功能的数据模型。

基于当前团队的资源和能力，优先调研了Alibaba开源中间件Canal的使用。

这篇文章简单介绍一下如何快速地搭建一套Canal相关的组件。

关于Canal

简介

下面的简介和下一节的原理均来自于Canal项目的README：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

Canal[k?'næl]，译意为水道/管道/沟渠，主要用途是基于MySQL数据库增量日志解析，提供增量数据订阅和消费。早期阿里巴巴因为杭州和美国双机房部署，存在跨机房同步的业务需求，实现方式主要是基于业务trigger获取增量变更。从 2010 年开始，业务逐步尝试数据库日志解析获取增量变更进行同步，由此衍生出了大量的数据库增量订阅和消费业务。

基于日志增量订阅和消费的业务包括：

数据库镜像
数据库实时备份
索引构建和实时维护（拆分异构索引、倒排索引等）
业务Cache刷新
带业务逻辑的增量数据处理

Canal的工作原理

MySQL主备复制原理：

MySQL的Master实例将数据变更写入二进制日志（binary log，其中记录叫做二进制日志事件binary log events，可以通过show binlog events进行查看）
MySQL的Slave实例将master的binary log events拷贝到它的中继日志（relay log）
MySQL的Slave实例重放relay log中的事件，将数据变更反映它到自身的数据

Canal的工作原理如下：

Canal模拟MySQL Slave的交互协议，伪装自己为MySQL Slave，向MySQL Master发送dump协议
MySQL Master收到dump请求，开始推送binary log给Slave（即Canal）
Canal解析binary log对象（原始为byte流），并且可以通过连接器发送到对应的消息队列等中间件中

关于Canal的版本和部件

截止笔者开始编写本文的时候（2020-03-05），Canal的最新发布版本是v1.1.5-alpha-1（2019-10-09发布的），最新的正式版是v1.1.4（2019-09-02发布的）。其中，v1.1.4主要添加了鉴权、监控的功能，并且做了一些列的性能优化，此版本集成的连接器是Tcp、Kafka和RockerMQ。

而v1.1.5-alpha-1版本已经新增了RabbitMQ连接器，但是此版本的RabbitMQ连接器暂时不能定义连接RabbitMQ的端口号，不过此问题已经在master分支中修复（具体可以参看源码中的CanalRabbitMQProducer类的提交记录）。

换言之，v1.1.4版本中目前能使用的内置连接器只有Tcp、Kafka和RockerMQ三种，如果想尝鲜使用RabbitMQ连接器，可以选用下面的两种方式之一：

选用v1.1.5-alpha-1版本，但是无法修改RabbitMQ的port属性，默认为5672。
基于master分支自行构建Canal。

目前，Canal项目的活跃度比较高，但是考虑到功能的稳定性问题，笔者建议选用稳定版本在生产环境中实施，当前可以选用v1.1.4版本，本文的例子用选用的就是v1.1.4版本，配合Kafka连接器使用。Canal主要包括三个核心部件：

canal-admin：后台管理模块，提供面向WebUI的Canal管理能力。
canal-adapter：适配器，增加客户端数据落地的适配及启动功能，包括REST、日志适配器、关系型数据库的数据同步（表对表同步）、HBase数据同步、ES数据同步等等。
canal-deployer：发布器，核心功能所在，包括binlog解析、转换和发送报文到连接器中等等功能都由此模块提供。

一般情况下，canal-deployer部件是必须的，其他两个部件按需选用即可。

部署所需的中间件

搭建一套可以用的组件需要部署MySQL、Zookeeper、Kafka和Canal四个中间件的实例，下面简单分析一下部署过程。选用的虚拟机系统是CentOS7。

安装MySQL

为了简单起见，选用yum源安装（官方链接是https://dev.mysql.com/downloads/repo/yum）：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

mysql80-community-release-el7-3虽然包名带了mysql80关键字，其实已经集成了MySQL主流版本5.6、5.7和8.x等等的最新安装包仓库

选用的是最新版的MySQL8.x社区版，下载CentOS7适用的rpm包：

cd?/data/mysql
wget?https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm
//?下载完毕之后
sudo?rpm?-Uvh?mysql80-community-release-el7-3.noarch.rpm

此时列举一下yum仓库里面的MySQL相关的包：

[root@localhost?mysql]#?yum?repolist?all?|?grep?mysql
mysql-cluster-7.5-community/x86_64?MySQL?Cluster?7.5?Community???disabled
mysql-cluster-7.5-community-source?MySQL?Cluster?7.5?Community?-?disabled
mysql-cluster-7.6-community/x86_64?MySQL?Cluster?7.6?Community???disabled
mysql-cluster-7.6-community-source?MySQL?Cluster?7.6?Community?-?disabled
mysql-cluster-8.0-community/x86_64?MySQL?Cluster?8.0?Community???disabled
mysql-cluster-8.0-community-source?MySQL?Cluster?8.0?Community?-?disabled
mysql-connectors-community/x86_64??MySQL?Connectors?Community????enabled:????141
mysql-connectors-community-source??MySQL?Connectors?Community?-??disabled
mysql-tools-community/x86_64???????MySQL?Tools?Community?????????enabled:????105
mysql-tools-community-source???????MySQL?Tools?Community?-?Sourc?disabled
mysql-tools-preview/x86_64?????????MySQL?Tools?Preview???????????disabled
mysql-tools-preview-source?????????MySQL?Tools?Preview?-?Source??disabled
mysql55-community/x86_64???????????MySQL?5.5?Community?Server????disabled
mysql55-community-source???????????MySQL?5.5?Community?Server?-??disabled
mysql56-community/x86_64???????????MySQL?5.6?Community?Server????disabled
mysql56-community-source???????????MySQL?5.6?Community?Server?-??disabled
mysql57-community/x86_64???????????MySQL?5.7?Community?Server????disabled
mysql57-community-source???????????MySQL?5.7?Community?Server?-??disabled
mysql80-community/x86_64???????????MySQL?8.0?Community?Server????enabled:????161
mysql80-community-source???????????MySQL?8.0?Community?Server?-??disabled

编辑/etc/yum.repos.d/mysql-community.repo文件（[mysql80-community]块中enabled设置为1，其实默认就是这样子，不用改，如果要选用5.x版本则需要修改对应的块）：

[mysql80-community]
name=MySQL?8.0?Community?Server
baseurl=http://repo.mysql.com/yum/mysql-8.0-community/el/7/$basearch/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-mysql

然后安装MySQL服务：

sudo?yum?install?mysql-community-server

这个过程比较漫长，因为需要下载和安装5个rpm安装包（或者是所有安装包组合的压缩包mysql-8.0.18-1.el7.x86_64.rpm-bundle.tar）。如果网络比较差，也可以直接从官网手动下载后安装：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

//?下载下面5个rpm包?common?-->?libs?-->?libs-compat?-->?client?-->?server
mysql-community-common
mysql-community-libs
mysql-community-libs-compat
mysql-community-client
mysql-community-server

//?强制安装
rpm?-ivh?mysql-community-common-8.0.18-1.el7.x86_64.rpm?--force?--nodeps
rpm?-ivh?mysql-community-libs-8.0.18-1.el7.x86_64.rpm?--force?--nodeps
rpm?-ivh?mysql-community-libs-compat-8.0.18-1.el7.x86_64.rpm?--force?--nodeps
rpm?-ivh?mysql-community-client-8.0.18-1.el7.x86_64.rpm?--force?--nodeps
rpm?-ivh?mysql-community-server-8.0.18-1.el7.x86_64.rpm?--force?--nodeps

安装完毕之后，启动MySQL服务，然后搜索MySQL服务的root账号的临时密码用于首次登陆（mysql -u root -p）：

//?启动服务，关闭服务就是service?mysqld?stop
service?mysqld?start
//?查看临时密码?cat?/var/log/mysqld.log
[root@localhost?log]#?cat?/var/log/mysqld.log?
2020-03-02T06:03:53.996423Z?0?[System]?[MY-013169]?[Server]?/usr/sbin/mysqld?(mysqld?8.0.18)?initializing?of?server?in?progress?as?process?22780
2020-03-02T06:03:57.321447Z?5?[Note]?[MY-010454]?[Server]?A?temporary?password?is?generated?for?root@localhost:?>kjYaXENK6li
2020-03-02T06:04:00.123845Z?0?[System]?[MY-010116]?[Server]?/usr/sbin/mysqld?(mysqld?8.0.18)?starting?as?process?22834
//?登录临时root用户，使用临时密码
[root@localhost?log]#?mysql?-u?root?-p

接下来做下面的操作：

修改root用户的密码：ALTER USER 'root'@'localhost' IDENTIFIED BY 'QWqw12!@';（注意密码规则必须包含大小写字母、数字和特殊字符）
更新root的host，切换数据库use mysql;，指定host为%以便可以让其他服务器远程访问UPDATE USER SET HOST = '%' WHERE USER = 'root';
赋予'root'@'%'用户，所有权限，执行GRANT ALL PRIVILEGES ON?.?TO 'root'@'%';
改变root'@'%用户的密码校验规则以便可以使用Navicat等工具访问：ALTER USER 'root'@'%' IDENTIFIED WITH mysql_native_password BY 'QWqw12!@';

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

操作完成之后，就可以使用root用户远程访问此虚拟机上的MySQL服务。最后确认是否开启了binlog（注意一点是MySQL8.x默认开启binlog）SHOW VARIABLES LIKE '%bin%';：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

最后在MySQL的Shell执行下面的命令，新建一个用户名canal密码为QWqw12!@的新用户，赋予REPLICATION SLAVE和 REPLICATION CLIENT权限：

CREATE?USER?canal?IDENTIFIED?BY?'QWqw12!@';
GRANT?SELECT,?REPLICATION?SLAVE,?REPLICATION?CLIENT?ON?*.*?TO?'canal'@'%';
FLUSH?PRIVILEGES;
ALTER?USER?'canal'@'%'?IDENTIFIED?WITH?mysql_native_password?BY?'QWqw12!@';

切换回去root用户，创建一个数据库test：

CREATE?DATABASE?`test`?CHARSET?`utf8mb4`?COLLATE?`utf8mb4_unicode_ci`;

安装Zookeeper

Canal和Kafka集群都依赖于Zookeeper做服务协调，为了方便管理，一般会独立部署Zookeeper服务或者Zookeeper集群。笔者这里选用2020-03-04发布的3.6.0版本：

midkr?/data/zk
#?创建数据目录
midkr?/data/zk/data
cd?/data/zk
wget?http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz
tar?-zxvf?apache-zookeeper-3.6.0-bin.tar.gz
cd?apache-zookeeper-3.6.0-bin/conf
cp?zoo_sample.cfg?zoo.cfg?&&?vim?zoo.cfg

把zoo.cfg文件中的dataDir设置为/data/zk/data，然后启动Zookeeper：

[root@localhost?conf]#?sh?/data/zk/apache-zookeeper-3.6.0-bin/bin/zkServer.sh?start
/usr/bin/java
ZooKeeper?JMX?enabled?by?default
Using?config:?/data/zk/apache-zookeeper-3.6.0-bin/bin/../conf/zoo.cfg
Starting?zookeeper?...?STARTED

这里注意一点，要启动此版本的Zookeeper服务必须本地安装好JDK8+，这一点需要自行处理。启动的默认端口是2181，启动成功后的日志如下：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

安装Kafka

Kafka是一个高性能分布式消息队列中间件，它的部署依赖于Zookeeper。笔者在此选用2.4.0并且Scala版本为2.13的安装包：

mkdir?/data/kafka
mkdir?/data/kafka/data
wget?http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.4.0/kafka_2.13-2.4.0.tgz
tar?-zxvf?kafka_2.13-2.4.0.tgz

由于解压后/data/kafka/kafka_2.13-2.4.0/config/server.properties配置中对应的zookeeper.connect=localhost:2181已经符合需要，不必修改，需要修改日志文件的目录log.dirs为/data/kafka/data。然后启动Kafka服务：

sh?/data/kafka/kafka_2.13-2.4.0/bin/kafka-server-start.sh?/data/kafka/kafka_2.13-2.4.0/config/server.properties

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

这样启动一旦退出控制台就会结束Kafka进程，可以添加-daemon参数用于控制Kafka进程后台不挂断运行。

sh?/data/kafka/kafka_2.13-2.4.0/bin/kafka-server-start.sh?-daemon?/data/kafka/kafka_2.13-2.4.0/config/server.properties

安装和使用Canal

终于到了主角登场，这里选用Canal的v1.1.4稳定发布版，只需要下载deployer模块：

mkdir?/data/canal
cd?/data/canal
#?这里注意一点，Github在国内下载速度极慢，可以先用其他下载工具下载完再上传到服务器中
wget?https://github.com/alibaba/canal/releases/download/canal-1.1.4/canal.deployer-1.1.4.tar.gz
tar?-zxvf?canal.deployer-1.1.4.tar.gz

解压后的目录如下：

-?bin???#?运维脚本
-?conf??#?配置文件
??canal_local.properties??#?canal本地配置，一般不需要动
??canal.properties????????#?canal服务配置
??logback.xml?????????????#?logback日志配置
??metrics?????????????????#?度量统计配置
??spring??????????????????#?spring-实例配置，主要和binlog位置计算、一些策略配置相关，可以在canal.properties选用其中的任意一个配置文件
??example?????????????????#?实例配置文件夹，一般认为单个数据库对应一个独立的实例配置文件夹
????instance.properties???#?实例配置，一般指单个数据库的配置
-?lib???#?服务依赖包
-?logs??#?日志文件输出目录

在开发和测试环境建议把logback.xml的日志级别修改为DEBUG方便定位问题。这里需要关注canal.properties和instance.properties两个配置文件。canal.properties文件中，需要修改：

去掉canal.instance.parser.parallelThreadSize = 16这个配置项的注释，也就是启用此配置项，和实例解析器的线程数相关，不配置会表现为阻塞或者不进行解析。
canal.serverMode配置项指定为kafka，可选值有tcp、kafka和rocketmq（master分支或者最新的的v1.1.5-alpha-1版本，可以选用rabbitmq），默认是kafka。
canal.mq.servers配置需要指定为Kafka服务或者集群Broker的地址，这里配置为127.0.0.1:9092。

canal.mq.servers在不同的canal.serverMode有不同的意义。

kafka模式下，指Kafka服务或者集群Broker的地址，也就是bootstrap.servers
rocketmq模式下，指NameServer列表
rabbitmq模式下，指RabbitMQ服务的Host和Port

其他配置项可以参考下面两个官方Wiki的链接：

https://github.com/alibaba/canal/wiki/Canal-Kafka-RocketMQ-QuickStart
https://github.com/alibaba/canal/wiki/AdminGuide

instance.properties一般指一个数据库实例的配置，Canal架构支持一个Canal服务实例，处理多个数据库实例的binlog异步解析。instance.properties需要修改的配置项主要包括：

1.canal.instance.mysql.slaveId需要配置一个和Master节点的服务ID完全不同的值，这里笔者配置为654321。

2.配置数据源实例，包括地址、用户、密码和目标数据库：

canal.instance.master.address，这里指定为127.0.0.1:3306。
canal.instance.dbUsername，这里指定为canal。
canal.instance.dbPassword，这里指定为QWqw12!@。
新增canal.instance.defaultDatabaseName，这里指定为test（需要在MySQL中建立一个test数据库，见前面的流程）。

3.Kafka相关配置，这里暂时使用静态topic和单个partition：

canal.mq.topic，这里指定为test，也就是解析完的binlog结构化数据会发送到Kafka的命名为test的topic中。
canal.mq.partition，这里指定为0。

配置工作做好之后，可以启动Canal服务：

sh?/data/canal/bin/startup.sh?
#?查看服务日志
tail?-100f?/data/canal/logs/canal/canal
#?查看实例日志??--?一般情况下，关注实例日志即可
tail?-100f?/data/canal/logs/example/example.log

启动正常后，见实例日志如下：

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

在test数据库创建一个订单表，并且执行几个简单的DML：

use?`test`;

CREATE?TABLE?`order`
(
????id??????????BIGINT?UNIQUE?PRIMARY?KEY?AUTO_INCREMENT?COMMENT?'主键',
????order_id????VARCHAR(64)????NOT?NULL?COMMENT?'订单ID',
????amount??????DECIMAL(10,?2)?NOT?NULL?DEFAULT?0?COMMENT?'订单金额',
????create_time?DATETIME???????NOT?NULL?DEFAULT?CURRENT_TIMESTAMP?COMMENT?'创建时间',
????UNIQUE?uniq_order_id?(`order_id`)
)?COMMENT?'订单表';

INSERT?INTO?`order`(order_id,?amount)?VALUES?('10086',?999);
UPDATE?`order`?SET?amount?=?10087?WHERE?order_id?=?'10086';
DELETE??FROM?`order`?WHERE?order_id?=?'10086';

这个时候，可以利用Kafka的kafka-console-consumer或者Kafka Tools查看test这个topic的数据：

sh?/data/kafka/kafka_2.13-2.4.0/bin/kafka-console-consumer.sh?--bootstrap-server?127.0.0.1:9092?--from-beginning?--topic?test

基于Canal和Kafka实现MySQL的Binlog近实时同步 - 文章图片

具体的数据如下：

//?test数据库建库脚本
{"data":null,"database":"`test`","es":1583143732000,"id":1,"isDdl":false,"mysqlType":null,"old":null,"pkNames":null,"sql":"CREATE?DATABASE?`test`?CHARSET?`utf8mb4`?COLLATE?`utf8mb4_unicode_ci`","sqlType":null,"table":"","ts":1583143930177,"type":"QUERY"}

//?order表建表DDL
{"data":null,"database":"test","es":1583143957000,"id":2,"isDdl":true,"mysqlType":null,"old":null,"pkNames":null,"sql":"CREATE?TABLE?`order`\n(\n????id??????????BIGINT?UNIQUE?PRIMARY?KEY?AUTO_INCREMENT?COMMENT?'主键',\n????order_id????VARCHAR(64)????NOT?NULL?COMMENT?'订单ID',\n????amount??????DECIMAL(10,?2)?NOT?NULL?DEFAULT?0?COMMENT?'订单金额',\n????create_time?DATETIME???????NOT?NULL?DEFAULT?CURRENT_TIMESTAMP?COMMENT?'创建时间',\n????UNIQUE?uniq_order_id?(`order_id`)\n)?COMMENT?'订单表'","sqlType":null,"table":"order","ts":1583143958045,"type":"CREATE"}

//?INSERT
{"data":[{"id":"1","order_id":"10086","amount":"999.0","create_time":"2020-03-02?05:12:49"}],"database":"test","es":1583143969000,"id":3,"isDdl":false,"mysqlType":{"id":"BIGINT","order_id":"VARCHAR(64)","amount":"DECIMAL(10,2)","create_time":"DATETIME"},"old":null,"pkNames":["id"],"sql":"","sqlType":{"id":-5,"order_id":12,"amount":3,"create_time":93},"table":"order","ts":1583143969460,"type":"INSERT"}

//?UPDATE
{"data":[{"id":"1","order_id":"10086","amount":"10087.0","create_time":"2020-03-02?05:12:49"}],"database":"test","es":1583143974000,"id":4,"isDdl":false,"mysqlType":{"id":"BIGINT","order_id":"VARCHAR(64)","amount":"DECIMAL(10,2)","create_time":"DATETIME"},"old":[{"amount":"999.0"}],"pkNames":["id"],"sql":"","sqlType":{"id":-5,"order_id":12,"amount":3,"create_time":93},"table":"order","ts":1583143974870,"type":"UPDATE"}

//?DELETE
{"data":[{"id":"1","order_id":"10086","amount":"10087.0","create_time":"2020-03-02?05:12:49"}],"database":"test","es":1583143980000,"id":5,"isDdl":false,"mysqlType":{"id":"BIGINT","order_id":"VARCHAR(64)","amount":"DECIMAL(10,2)","create_time":"DATETIME"},"old":null,"pkNames":["id"],"sql":"","sqlType":{"id":-5,"order_id":12,"amount":3,"create_time":93},"table":"order","ts":1583143981091,"type":"DELETE"}

可见Kafka的名为test的topic已经写入了对应的结构化binlog事件数据，可以编写消费者监听Kafka对应的topic然后对获取到的数据进行后续处理。

小结

这篇文章大部分篇幅用于介绍其他中间件是怎么部署的，这个问题侧面说明了Canal本身部署并不复杂，它的配置文件属性项比较多，但是实际上需要自定义和改动的配置项是比较少的，也就是说明了它的运维成本和学习成本并不高。后面会分析基于结构化binlog事件做ELT和持久化相关工作以及Canal的生产环境可用级别HA集群的搭建。

内容总结

以上是互联网集市为您收集整理的基于Canal和Kafka实现MySQL的Binlog近实时同步全部内容，希望文章能够帮你解决基于Canal和Kafka实现MySQL的Binlog近实时同步所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/875339.html

来源：【匿名】

【上一篇】MySQL修改密码的四种方法【下一篇】用IE远程创建Mysql数据库的简易程序

更多 ►

【基于Canal和Kafka实现MySQL的Binlog近实时同步】教程文章相关的互联网学习教程文章

（4.11）mysql备份还原——mysql闪回技术（基于binlog）

0、闪回技术与工具简介mysql闪回工具比较流行三大类：【0.1】官方的mysqlbinlog：支持数据库在线/离线，用脚本处理binlog的输出，转化成对应SQL再执行。通用性不好，对正则、sed等需要较高熟练度。【0.2】第三方的mysqlbinlog工具，比官方的工具多了一个闪回功能 -B【0.3】开源的binlog2sql：兼容性比较好，使用难度小，使用简单，前提是mysql必须开启。最佳实践：线上使用binlog2sql，线下用mysqlbinlog以及mysqlbinlog_flashbac...

mysql-5.7.17 binlog查询【代码】

因为有的时候会出现，突然哪个字段或者表格之类被删除，我们要了解到底什么内容，什么时候，是谁删的，那我们就可以从binlog日志中查找到你需要的内容1.binlog binlog就是二进制日志，它记录了数据库上的所有改变，并以二进制的形式保存在磁盘中；它可以用来查看数据库的变更历史、数据库增量备份和恢复、MySQL的复制（主从数据库的复制）。因为每一条被修改数据的sql都会记录在binlog中。 2.查看与配置binlog格式 (1)查看binlog...

mysqlbinlog 查看binlog日志时报错unknown variable 'default-character-set=utf8'【代码】

mysqlbinlog 查看binlog日志时报错unknown variable ‘default-character-set=utf8‘ 在通过全备文件和增量binlog文件来导出sql文件，用以恢复完整的数据库时。由于裸的binlog文件是无法直视的，所以使用mysqlbinlog这个工具是用来查看binlog文件内容的（使用方式man mysqlbinlog查看），但是使用mysqlbinlog将binlog文件转换成人类可读的内容时却报错：[root@server data]$ mysqlbinlog mysql-bin.000009 mysqlbinlog: ...

mysql binlog配置详解

关闭binlog，注释掉mysql配置文件中的log-bin=mysql-bin即可 baidu zone - 关闭binlog方法 cnblogs - linux下mysql配置文件my.cnf详解 ChinaUnix Blog - 设置自动清理mysql binlog日志和手动删除的方法 51cto - 删除庞大的MySQL binlog实操 csdn - 删除MySQL 的 binlog原文：http://www.cnblogs.com/svennee/p/4084474.html

binlog2sql mysql闪回【代码】【图】

环境搭建1、虚拟机配置请参考https://www.cnblogs.com/public-communion/p/14629113.html2、mysql 安装请参考https://www.cnblogs.com/public-communion/p/14629060.html3、git安装查看是否安装git# git --version 出现版本号，则说明已安装。如未安装，自行百度。4、pip安装# wget https://bootstrap.pypa.io/pip/2.7/get-pip.py # python get-pip.py # pip -V 如执行上述代码未安装成功，请看下面：执行第二段代码遇到截图的错误...

MySQL的两个日志redo log和 binlog

MySQL的修改创建，涉及到写的东西，他们都会涉及两个重要的日志模块，redo log（重做日志）和 binlog（归档日志）。redo log在 MySQL 里也有这个问题，如果每一次的写操作都需要写进磁盘，然后磁盘也要找到对应的那条记录，然后再更新，整个过程 IO 成本、查找成本都很高。为了解决这个问题，MySQL 的设计者使用了redo log日志 redo log是InnoDB 引擎所特有的，当有些动作时，会先把记录写到 redo log文件里面，这个时候更新就算完...

MySQL 8.0版本 binlog2sql 解析binlog【代码】【图】

概述 binlog2sql是一个Python开发开源的MySQL Binlog解析工具，能够将Binlog解析为原始的SQL，也支持将Binlog解析为回滚的SQL，去除主键的INSERT SQL，是DBA和运维人员数据恢复好帮手。一、安装配置1.1 用途数据快速回滚(闪回)主从切换后新master丢数据的修复从binlog生成标准SQL，带来的衍生功能支持MySQL5.6，5.71.2 安装shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sqlshell> pip install -r ...

MySQL——binlog【代码】

一、binlog简介：1、什么是binlog： binlog日志用于记录所有更新了数据或者已经潜在更新了数据（例如，没有匹配任何行的一个DELETE）的所有语句。语句以“事件”的形式保存，它描述数据更改。2、binlog的记录格式：Mysql binlog日志有三种格式，分别为：Statement ,MiXED ,和ROW；（在MySQL5.7.7版本之后，把binlog_format的默认值修改成了ROW。master将修改表的event写入binlog中，并且master将binlog信息发送到slave，slave重...

怎么查看mysql 的binlog日志存放的位置【图】

image.png这个你可以看配置文件启用了才有这样的记录默认是没有的 linux系统中的/etc/my.cnfmy.cnf内容：log-bin = mysqlbin # 默认配置一般放在/var/lib/mysql 比如上面的设置重启数据库会生成mysqlbin.000001文件自定义文件存放位置修改配置文件，vi /etc/my.cnf，找到log-bin的部分配置自动清理在my.cnf文件中，这个文件路径不知道的话执行mysql --help | grep ‘Default options‘ -A 1，就会列出文件的路径来image.png然后重...

MYSQL的mysqldump+binlog备份【图】

mysql是一个关系型数据库管理系统，由瑞典Mysql AB公司开发，目前属于Oracle旗下的产品。Mysql是最流行的关系型数据库之一，在web应用方面，Mysql是最好的RDBMS(Relational Database Management System，关系型数据库管理系统)应用软件。 MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策，分为社区版和商业版，由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，一般中小型...

MySQL Binlog和Relaylog生成和清理

=====================================================================================binlog文件生成：在每条二进制日志写入到日志文件后，会判断该文件是否超过max_binlog_size，如果超过则生成一个新的binlog=====================================================================================binlog文件删除：1>当使用RESET MASTER命令后，会清空全部二进制日志命令：RESET MASTER;2>当执行PURGE MASTER LOG TO命令后...

解析MySQL binlog --（3）QUERY_EVENT【代码】【图】

mysql原理~binlog系列之~event浅谈

一将具体分析binlog中的常用event二 Row格式事件核心 ROW_LOG_EVENT+TABLE_MAP_EVENT+GTID_EVENT三 event生效机制在binlog cache中生效,然后刷新纪录写入binlog中四具体event 内容 0 FORMAT_DESCRIPTION_EVENT 1 PREVIOUS_GTIDS_LOG_EVENT 2 GTID_LOG_EVENT 3 TABLE_MAP_EVENT 4 ROW_LOG_EVENT 5 QUERY_EVENT () 6 XID_EVENT 7 ROTATE_EVNET 8 STOP_EVENT五详解 0 FORMAT_DESCRIPTION_EVENT ...

mysql的binlog安全删除【代码】【图】

1.手动清除binlog文件理论上，应该在配置文件/etc/my.cnf中加上binlog过期时间的配置项，expire_logs_days = 10.但是如果没有加这一项，随着产生越来越多的binlog，磁盘被吃掉了不少。可以直接删除binlog文件，但是可以通过mysql提供的工具来删除更安全。因为purge会更新mysql-bin.index中的条目，而直接删除的话，mysql-bin.index文件不会更新。mysql-bin.index的作用是加快查找binlog文件的速度。先help一下吧...

烂泥：通过binlog恢复mysql数据库【图】

本文由秀依林枫提供友情赞助，首发于烂泥行天下。在上一篇文章，我们讲解了有关mysql的binlog日志的基础知识。这篇文章，我们来讲解如何通过mysql的binlog日志来恢复数据库。在使用binlog日志来恢复数据库之前，我们有一些前提工作需要做。步骤如下：1、创建新的数据库ailanni2、创建新的表ilannitable3、向表ilannitable插入数据4、刷新mysqlbin日志5、完整备份ailanni数据库6、删除表ilannitable插入的部分数据7、删除数据库aila...

首页 / MYSQL / 基于Canal和Kafka实现MySQL的Binlog近实时同步

基于Canal和Kafka实现MySQL的Binlog近实时同步

内容导读

内容图文

前提

关于Canal

简介

Canal的工作原理

关于Canal的版本和部件

部署所需的中间件

安装MySQL

安装Zookeeper

安装Kafka

安装和使用Canal

小结

内容总结

内容备注

内容手机端

【基于Canal和Kafka实现MySQL的Binlog近实时同步】教程文章相关的互联网学习教程文章

（4.11）mysql备份还原——mysql闪回技术（基于binlog）

mysql-5.7.17 binlog查询【代码】

mysqlbinlog 查看binlog日志时报错unknown variable 'default-character-set=utf8'【代码】

mysql binlog配置详解

binlog2sql mysql闪回【代码】【图】

MySQL的两个日志redo log和 binlog

MySQL 8.0版本 binlog2sql 解析binlog【代码】【图】

MySQL——binlog【代码】

怎么查看mysql 的binlog日志存放的位置【图】

MYSQL的mysqldump+binlog备份【图】

MySQL Binlog和Relaylog生成和清理

解析MySQL binlog --（3）QUERY_EVENT【代码】【图】

mysql原理~binlog系列之~event浅谈

mysql的binlog安全删除【代码】【图】

烂泥：通过binlog恢复mysql数据库【图】

MYSQL - 相关标签

实时 - 相关标签

同步 - 相关标签

MYSQL - 技术教程分类

MYSQL - 最新教程

MYSQL - 最热教程