HBase的备份以及恢复方案

HBase Backup/Restore 方案

 本文开始我们会介绍HBase关于Backup/Restore的方案,虽然HBase2.0的release 版本里面并不会带有该功能,但是我们ApsaraDB for HBase会对应的提供该功能。我们经常会听到“某某某DBA误操作把整张表删了”,“某某磁盘故障,造成数据库的某个库的数据全部损坏了”。这种由于外在和内在的原因造成的数据不可靠,最终会给用户带来毁灭性的灾难。所以基本上所有的数据库都会对应的提供Backup/Restore的方案,以防用户误操物理上删除了一整个表或者别的问题造成的悲剧; 一般通过定时的做备份无论是全量数据做备份还是对增量数据做备份,此外一旦遇到上面提到“悲剧”,通过一键命令就可以恢复数据;
 本文开始我们大概的文章架构是:常见的数据库backup/restore方案;云HBase的Backup/Restore方案;我们接下来的工作计划;

1.常见的数据库Backup/Restore方案

 单机的数据库有MySQL,pg等,一般的话,MySQL的备份的话,可以有备份数据文件的方式到本地磁盘,也有直接进行逻辑备份,操作的SQL语句;其他的单机数据库使用的技术也是差不多;
 分布数据库的话Cassandra的话,也是对数据做快照,然后copy 文件到一个备份的地方,增量备份的话使用备份wal log的方式,但是存在问题是:恢复的话,需要恢复到对等的拓扑结构的集群,再次增量备份wal的话会存在多倍的网卡开销;
 现在来大概介绍HBase的备份和恢复的机制,和单机数据库对比的话意义不大。全量数据备份的话,HBase会对本地文件做一个snapshot,然后通过mr的方式将数据文件copy到一个特定的指定地方,增量备份的话,通过将wal log转换为Hfile,然后copy到远端一个特定备份的地方。这种增量备份是主要备份wal log,且是指定时间的做备份,一天或者一周。
 对于恢复模块的话,可以是全量的数据恢复以及增量的数据恢复,基本的逻辑都是将文件copy到HDFS上,然后做一次bulkload即可将数据恢复回来。

2.云HBase的Backup/Restore方案

 这里分别从4个方面进行介绍,主要是:常见使用方法,全量数据备份和恢复,增量数据备份和恢复,我们即将提供的一些特定功能。

 ApsaraDB for HBase提供的数据备份 可以支持备份到不同地区的HDFS,也支持备份到OSS上面。大概的逻辑可以参考下面的图
2.1. 使用方法

2.1.1.hbase backup create full/incremental path
full:创建全量备份
incremental:创建增量备份 path:备份到的文件系统以及对应的路径
可以跟的选项:-t table;如果不写就是全部的表都备份
-w 后面跟的数字,表示多少个工作任务
-s 备份的set
-b 控制备份的带宽
2.1.2.hbase restore path backupid path:备份的路径
backupid:备份的id;
后面可以的选项: -o 覆盖之前的表
-t 备份的表,其他选项类似
2.1.3.hbase backup merge <backup_ids>
把一些backup的id进行merge,可以是每日的backup merge成一个;
2.1.4.hbase backup progress <backup_id>
展示backup进度

2.2.全量备份和恢复

这里说的全量备份,主要是从某一个时间点开始做数据备份,这个点之前都没有做过备份,那么这次备份就是全量数据备份,需要使用create full 这个命令;备份的path是我们预先设定好的可以是HDFS的路径也可以是OSS的路径,那么对应的HBase就会存在下面几个流程

1.backup:system表做snapshot;
2.全局barrier然后让各个rs做log roll,并将各个rs的最新的log的ts记录到backup:system表了;
3.然后各个rs做snapshot,然后mr跑数据,做数据copy到对应path下;完成以后update下system表;并将数据更新到备份的文件系统上面。

 上面大概就是HBase的全量备份的流程,整个流程下来,我们做一个对比,因为HBase 在Hadoop生态下面,引入MR做批处理数据操作是轻而易举的事情,但是别的分布式数据库做这个操作就是比较困难的。下面的流程是HBase做全量恢复的流程

0.load 最新的table的原信息(通过备份好的文件),对应的在restore的节点上面进行建表;
1.把对应的full backup下面的data通过mr的形式丢在hdfs上面的一个临时文件下面;
2.bulkload对应的这些文件;

 同理整个流程下来主要是依赖MR的批处理能力做加速,当然通过bulkload将文件进行恢复也是海量数据下的恢复的最快的一种办法;

2.3.增量备份和恢复

 增量的备份的话,主要是在一个HBase集群做完一次全量备份以后的每一次的增量数据的备份都叫做增量备份,HBase主要是依赖WAL log做数据备份的主体,因为WAL log是增量数据里面最全的,先写wal 才可以存Memstore,大概的备份和恢复的流程如下:

0.发送log roll到各个rs;各个rs也会把自己的当前的log最新信息记录到backup:system里面;
1.wal log转为hfile;(mr任务)
2.mr做数据copy到远端;
3.记录完成的wal log到backup:system表里;

0.load 最新的table的原信息,对应的在restore的节点上面进行建表等;
1.先做full restore,完成以后一步步的做增量的恢复,增量恢复到的时间点是你做增量的备份成功给出的那个backup id;
2.每一步都是先把wal的变成的hfile,做bulkload;

上述的方式除了可以引用MR做批处理外,保证输出的输出是一份完整的HFile,而不是某些DB那种各个节点输出一份数据,多倍数据输出,消耗了网卡等资源。

结束语

接下来我们会在现有backup/restore的基础上提供多种比较贴近生产需求的功能,比如cancel某个任务,恢复某个时间range的数据,保证功能稳定性等等。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,835评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,598评论 1 295
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,569评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,159评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,533评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,710评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,923评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,674评论 0 203
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,421评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,622评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,115评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,428评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,114评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,097评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,875评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,753评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,649评论 2 271

推荐阅读更多精彩内容