简介

MySQL自带的mysqldump工具只支持单线工作,一次一个个导出多个表,没有一个并行的机制,这就导致导出备份数据比较慢。

mysqldumper是一个很好支持多线程工作的实用工具,可以多线程从表中读入数据并同时写入到不同的文件里面。但是这个工具执行的时候需要加锁,导致表无法被修改。因此导出的操作最好是在从节点上进行。

mydumper特性

  1. 多线程备份

  2. 备份后会生成多个备份文件

  3. 备份时对MyISAM表施加FTWRL(FLUSH TABLES WITH READ LOCK),会阻塞DML语句

  4. 保证备份数据的一致性

  5. 支持文件压缩

  6. 支持导出binlog

  7. 支持多线程恢复

  8. 支持以守护进程模式工作,定时快照和连续二进制日志

  9. 支持将备份文件切块

安装

RedHat / Centos:

yum install https://github.com/maxbube/mydumper/releases/download/v0.9.5/mydumper-0.9.5-1.el7.x86_64.rpm

Ubuntu / Debian:

wget https://github.com/maxbube/mydumper/releases/download/v0.9.5/mydumper_0.9.5-1.xenial_amd64.deb
dpkg -i mydumper_0.9.5-1.xenial_amd64.deb

导出流程

  1. 主线程 FLUSH TABLES WITH READ LOCK, 施加全局只读锁,以阻止DML语句写入,保证数据的一致性

  2. 读取当前时间点的二进制日志文件名和日志写入的位置并记录在metadata文件中,以供即使点恢复使用

  3. N个(线程数可以指定,默认是4)dump线程 START TRANSACTION WITH CONSISTENT SNAPSHOT; 开启读一致的事物

  4. dump non-InnoDB tables, 首先导出非事物引擎的表

  5. 主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁

  6. dump InnoDB tables, 基于事物导出InnoDB表

  7. 事物结束

备份所生成的文件

  1. 所有的备份文件在一个目录中,目录可以自己指定;

  2. 目录中包含一个metadata文件:记录了备份数据库在备份时间点的二进制日志文件名,日志的写入位置;如果是在从库进行备份,还会记录备份时同步至主库的二进制日志文件及写入位置。

  3. 每个表有两个备份文件:database.table-schema.sql 表结构文件;database.table.sql 表数据文件;如果对表文件分片,将生成多个备份数据文件,可以指定行数或指定大小分片

命令参数

-B, --database              要备份的数据库,不指定则备份所有库
-T, --tables-list           需要备份的表,名字用逗号隔开
-o, --outputdir             备份文件输出的目录
-s, --statement-size        生成的insert语句的字节数,默认1000000
-r, --rows                  将表按行分块时,指定的块行数,指定这个选项会关闭 --chunk-filesize
-F, --chunk-filesize        将表按大小分块时,指定的块大小,单位是 MB
-c, --compress              压缩输出文件
-e, --build-empty-files     如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
-x, --regex                 是同正则表达式匹配 'db.table'
-i, --ignore-engines        忽略的存储引擎,用都厚分割
-m, --no-schemas            不备份表结构
-k, --no-locks              不使用临时共享只读锁,使用这个选项会造成数据不一致
--less-locking              减少对InnoDB表的锁施加时间(这种模式的机制下文详解)
-l, --long-query-guard      设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
--kill-long-queries         杀掉长查询 (不退出)
-b, --binlogs               导出binlog
-D, --daemon                启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
-I, --snapshot-interval     dump快照间隔时间,默认60s,需要在daemon模式下
-L, --logfile               使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
--tz-utc                    跨时区是使用的选项,不解释了
--skip-tz-utc               同上
--use-savepoints            使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
--success-on-1146           Not increment error count and Warning instead of Critical in case of table doesn't exist
-h, --host                  连接的主机名
-u, --user                  备份所使用的用户
-p, --password              密码
-P, --port                  端口
-S, --socket                使用socket通信时的socket文件
-t, --threads               开启的备份线程数,默认是4
-C, --compress-protocol     压缩与mysql通信的数据
-V, --version               显示版本号
-v, --verbose               输出信息模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为 2

例子

备份testdb到/data/backup/2019-04-27/01文件夹中,并压缩备份文件

mydumper -u root -ppassword -h localhost -B testdb -c -o /data/backup/2019-04-27/01

备份所有数据库,并备份二进制日志文件,备份至/data/backup/2019-04-27/02文件夹

mydumper -u root -ppassword -h localhost -o /data/backup/2019-04-27/02

备份testdb.opcai表,且不备份表结构,备份至/data/backup/2019-04-27/03文件夹

mydumper -u root -ppassword -h localhost -B testdb  -T opcai -m -o /data/backup/2019-04-27/03

还原

mysqlload -u root -ppassword -h localhost -B testdb -d /data/backup/2019-04-27/01