半同步复制

Ⅰ、认识半同步

我们目前MySQL默认的复制模式是异步复制,主不关心从的数据到哪里了,主宕了,做切换,如果从落后太多,就会导致丢失的数据太多

从5.5版本开始,MySQL引入了半同步复制

简单理解:一个事务提交时,日志至少要保证有一个从接收到,那么它的提交才能继续

到5.7版本,在原来半同步的基础上又出了一种半同步,叫无损复制,所以目前有两种半同步模式如下:

1.1 semi-syncreplication

  • 至少有一个从机收到binlog再返回
  • 减少数据丢失风险
  • 不能完全避免数据丢失
  • MySQL5.5版本开始支持

1.2 lossless semi-syncreplication

  • 二进制日志先写远端
  • 可保证数据完全不丢失
  • MySQL5.7版本开始支持

Ⅱ、玩一手半同步

配置 semi-sync replication

step1:
在线加载插件安装
(root@localhost) [(none)]> install plugin rpl_semi_sync_master soname 'semisync_master.so';
(root@localhost) [(none)]> install plugin rpl_semi_sync_slave soname 'semisync_slave.so';

写入配置文件
[mysqld]
plugin-dir=/usr/local/mysql/lib/plugin
plugin-load="rpl_semi_sync_master:semisync_master.so;rpl_semi_sync_slave:semisync_slave.so"

(root@localhost) [(none)]> show plugins;
截取一段
+----------------------------+----------+--------------------+--------------------+---------+
| rpl_semi_sync_master       | ACTIVE   | REPLICATION        | semisync_master.so | GPL     |
| rpl_semi_sync_slave        | ACTIVE   | REPLICATION        | semisync_slave.so  | GPL     |
+----------------------------+----------+--------------------+--------------------+---------+

可以看到已经装好了,还多了一些参数
(root@localhost) [(none)]> show variables like 'rpl%';
+-------------------------------------------+------------+
| Variable_name                             | Value      |
+-------------------------------------------+------------+
| rpl_semi_sync_master_enabled              | OFF        |
| rpl_semi_sync_master_timeout              | 10000      |
| rpl_semi_sync_master_trace_level          | 32         |
| rpl_semi_sync_master_wait_for_slave_count | 1          |
| rpl_semi_sync_master_wait_no_slave        | ON         |
| rpl_semi_sync_master_wait_point           | AFTER_SYNC |
| rpl_semi_sync_slave_enabled               | OFF        |
| rpl_semi_sync_slave_trace_level           | 32         |
| rpl_stop_slave_timeout                    | 31536000   |
+-------------------------------------------+------------+
9 rows in set (0.00 sec)

step2:
(root@localhost) [(none)]> set global rpl_semi_sync_master_enabled = 1;
(root@localhost) [(none)]> set global rpl_semi_sync_slave_enabled = 1;

tips:
配置文件里都配上哈,主从都搞好

重启一下复制
主上执行
(root@localhost) [(none)]> show global status like 'rpl%';
+--------------------------------------------+-------+
| Variable_name                              | Value |
+--------------------------------------------+-------+
| Rpl_semi_sync_master_clients               | 1     |
| Rpl_semi_sync_master_net_avg_wait_time     | 0     |
| Rpl_semi_sync_master_net_wait_time         | 0     |
| Rpl_semi_sync_master_net_waits             | 0     |
| Rpl_semi_sync_master_no_times              | 0     |
| Rpl_semi_sync_master_no_tx                 | 0     |
| Rpl_semi_sync_master_status                | ON    |
| Rpl_semi_sync_master_timefunc_failures     | 0     |
| Rpl_semi_sync_master_tx_avg_wait_time      | 0     |
| Rpl_semi_sync_master_tx_wait_time          | 0     |
| Rpl_semi_sync_master_tx_waits              | 0     |
| Rpl_semi_sync_master_wait_pos_backtraverse | 0     |
| Rpl_semi_sync_master_wait_sessions         | 0     |
| Rpl_semi_sync_master_yes_tx                | 0     |
| Rpl_semi_sync_slave_status                 | OFF   |
+--------------------------------------------+-------+
15 rows in set (0.03 sec)

这里面有一个超时,默认10s

如果超时了,会切为异步

相关参数:rpl_semi_sync_master_timeout

测试一把:
把从停掉(stop slave io_thread),主上insert,会被hang住,金融行业要超时时间设置很大,不让切异步,人工介入

主发给从,从没接收到,主提交不了

(root@localhost) [(none)]> show processlist;
+------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+
| Id   | User | Host      | db   | Command | Time | State                                | Info                                  |
+------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+
| 1460 | root | localhost | NULL | Query   |    0 | starting                             | show processlist                      |
| 1461 | root | localhost | test | Query   |    7 | Waiting for semi-sync ACK from slave | insert into flashback values(6,7,8,9) |
+------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+

跑sysbench批量插入,show processlist可以看到全是query end,卡住了,搞不进去,一会儿又恢复了
原因:10s后,半同步切换为异步了

此时主上看几个状态(截取几个重要的)
(root@localhost) [(none)]> show global status like 'rpl%';
+--------------------------------------------+---------+
| Variable_name                              | Value   |
+--------------------------------------------+---------+
| Rpl_semi_sync_master_clients               | 0       |
| Rpl_semi_sync_master_no_times              | 1       |    # 半同步切异步的次数
| Rpl_semi_sync_master_no_tx                 | 6588    |    # 切为异步后执行的事务数
| Rpl_semi_sync_master_status                | OFF     |
+--------------------------------------------+---------+
15 rows in set (0.00 sec)

从:
(root@localhost) [(none)]> start slave io_thread;
Query OK, 0 rows affected (0.00 sec)

主:
恢复半同步,状态正常

半同步小结:

  • 确保至少一个slave接收到日志
  • 一段时间内没接收到就切到异步
  • slave追上后又会自动切回半同步

Ⅲ、半同步原理浅析(两种模式)

3.1 semi-sync replication

半同步复制,一个事务提交(commit)时,在InnoDB层的commit log步骤后,Master节点需要收到至少一个Slave节点回复的ACK(表示收到了binlog )后,方可继续下一个事务

若在一定时间内(timeout)内没有收到ACK,则切换为异步模式,具体流程如下:

next commit <-+
              |Recv ACK   
+---------+   |      +--------+
|    M    |   |      |        |
| prepare |   +------+        |
+----v----+          |        |
|  binary | Wait Ack |   S    |
+----v----+   +------>        |
|  commit |   |      |        |
+----v----+   |      +--------+ 
     |        |
     +--------+
     
[mysqld]
rpl_semi_sync_master_enabled = 1
rpl_semi_sync_slave_enabled = 1
rpl_semi_sync_master_timeout = 1000

测试:

step1:
5.7默认是无损复制,先设一把普通半同步
主:
set global rpl_semi_sync_master_wait_point='after_commit';

step2:
主:
set global rpl_semi_sync_master_timeout = 3600;  不让切异步
create table a (a int primary key);
从:
stop slave io_thread;

step3:
主:
insert into a values(1);hang住咯
新开个线程,但可以看到这条记录

3.2 loss less semi-sync replication

无损复制,一个事务提交(commit)时,在server层的write binlog步骤后,Master节点需要收到至少一个Slave节点回复的ACK(表示收到了binlog )后,才能继续下一个事务

如果在一定时间内(timeout)内没有收到ACK ,则切换为异步模式 ,具体流程如下:

+---------+          +--------+
|    M    |          |        |
| prepare |          |        |
+----v----+          |        |
|  binary | +-------->        |
+----v----+ |Wait ACK|        |
|    |    | |        |    S   |
|    +------+        |        |
|         |          |        |
|    +---------------<        |        
|    v    | Recv ACK |        |
|  commit |          |        |
+----+----+          +--------+ 
     |
     v
  next commit

[mysqld]
rpl_semi_sync_master_wait_point = afer_sync
rpl_semi_sync_master_wait_for_slave_count = 1

对比after_commit测试

同样的测试,被hang住的那条插入,在主上是不可见的

tips:

主从还未切换,主恢复的话,在两种复制模式下,主从的数据都是最终一致的(配置是crash_safe的)

3.3 小结对比

半同步模式 等待ack时间点 数据一致性
after_commit commit后 无法保证主从一致
after_sync 写binlog后 主从一致

tips:
5.7新参数

rpl_semi_sync_master_wait_for_slave_count

之前的半同步是保证至少一个slave接收到binlog即可,这个参数可以设置多少个slave接收到日志主上才能commit

配置多个ACK和配置一个ACK的效果是类似的,因为他们是并行执行的(理论上来说不会有两倍的等待时间),取决于最慢的那个

建议设置从机数量的一半,类似group replication

但gr并没有走mysqldump去发送日志,它有专门的端口号,专门的paxos做日志发送,logshipping

Ⅳ、几种复制的性能对比

4.1 先吹两手

异步复制和半同步复制(无损)的性能差多少?

  • 只读的情况下,性能一样,因为没有产生二进制日志,谈不上主从
  • oltp脚本(14个select,4个update)跑,性能其实也差不多
  • update_none_index测试,差的也不多,百分之十的样子

综上:无损的半同步性能并不会下降非常多,性能下降多少和网络有关,用InfiniBand那更厉害了,另一点影响因素是事务的写入量,所以oltp差距不大

姜总测试报告:

两台不同机器,网络千兆,oltp,64个线程,异步和半同步差距可以忽略,百分之3到百分之5之间,纯update最差的时候差百分之三十

慢20%,主从严格一致,能接受不?

开更多线程呢?1024个线程去压呢?

半同步的性能会继续往上升,单个事务响应速度慢了,系统的整体吞吐率是上升的,所以生产环境中开启半同步,5.7场景打开after_sync(保证数据可靠性和性能的折中)

所以,5.7不用gr就能保证主从数据一致性,只是gr在做选主的话变成全自动了,不用mha,但它现在也还有一些明显的限制

4.2 再吹一手

从facebook测试结果看,after_commit性能很差,而无损复制比异步性能还好,为什么呢?

  • 就等待ACK回包问题上,其实两种复制的开销是一样的,没有区别,都是网络的等待开销
  • after_commit,主上一个事务等待提交的时候,不影响其他事务提交,性能一般
  • after_sync,一个事务卡住(waiting for semi-sync ack),后面事务都是query end状态(执行中,没在等ack,binlog已经传到从上了,等待第一个事务被唤醒,后面的所有事务一起做最后一次fsync),变相提高了第三步(innodb commit)组提交的效率,减少上下文切换,降低io开销,降低资源之间的竞争,提升磁盘吞吐率,性能较好
  • 线程数越多这种性能差距越明显

对比测试如下:

after_commit
(root@localhost) [(none)]> show processlist;
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+
| Id    | User | Host      | db   | Command | Time | State                                | Info                      |
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+
| 14905 | root | localhost | test | Query   |   14 | Waiting for semi-sync ACK from slave | insert into abc values(1) |
| 14906 | root | localhost | test | Query   |   10 | Waiting for semi-sync ACK from slave | insert into abc values(2) |
| 14907 | root | localhost | test | Query   |    7 | Waiting for semi-sync ACK from slave | insert into abc values(3) |
| 14908 | root | localhost | test | Query   |    4 | Waiting for semi-sync ACK from slave | insert into abc values(4  |
| 14909 | root | localhost | NULL | Query   |    0 | starting                             | show processlist          |
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+
5 rows in set (0.00 sec)

after_sync
(root@localhost) [(none)]> show processlist;
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+
| Id    | User | Host      | db   | Command | Time | State                                | Info                      |
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+
| 14905 | root | localhost | test | Query   |   57 | Waiting for semi-sync ACK from slave | insert into abc values(1) |
| 14906 | root | localhost | test | Query   |   37 | query end                            | insert into abc values(2) |
| 14907 | root | localhost | test | Query   |   29 | query end                            | insert into abc values(3) |
| 14908 | root | localhost | test | Query   |   21 | query end                            | insert into abc values(4) |
| 14909 | root | localhost | NULL | Query   |    0 | starting                             | show processlist          |
+-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+

tips:
①为什么after_sync会堆积事务? 这种情况下主接受ack是在一个串行锁(LOCK_COMMIT)的保护下进行的,通过pstack抓线程栈可以看得很清楚,这一点after_commit没有

②ping值返回0.1ms是个什么水准? 千兆网的速度,万兆网0.01ms的样子

③开启半同步复制,sync_binlog可以不设为1来提升性能

错,除非是无损复制(日志先传到slave,sync_binlog可以不用持久化,那after_commit呢)

如果master宕机了,sync_binlog日志没落盘,redo里面有日志,这时候重启就会回滚事务,

回滚后,那slave上又有这个事务,这样就主从不一致了

这种说法,每次主起来的时候需要把从上面的binlog补过来,这个很复杂,很少有人可以做,很难

④线上环境可以配置成两台Slave做无损复制(保证数据不丢),其他的Slave做异步复制(配置为只读,用于负载均衡),都指向同一台Master

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容