数据库常用架构和分库分表

MySQL数据库之互联网常用架构方案 - 尜尜人物 - 博客园

一、数据库架构原则

高可用(High Availbility)

高性能(High Performance)

一致性(Consistent)

扩展性(Scalability)

看到高可用,这个肯定是必须的,此外我还想到容灾。高可用保证了单一数据库失效不影响业务正常运行(多活/热备),或可以通过切换备份实例快速恢复(温备/冷备),不会丢失不可恢复的数据。为了防止在特殊外力下比如地震,不得不在异地备份数据,当本地异常后可以自动或手动倒换到异地。

二、常见的架构方案

方案一:主备架构,只有主库提供读写服务,备库冗余作故障转移用

jdbc:mysql://vip:3306/xxdb

高可用分析:高可用,主库挂了,会自动切换到备库。这个过程对业务层是透明的,无需修改代码或配置。

高性能分析:读写都操作主库,很容易产生瓶颈。大部分互联网应用读多写少(据说有个二八原则,80%读20%写),读会先成为瓶颈,进而影响写性能。另外,备库只是单纯的备份,资源利用率50%,这点方案二可解决。

一致性分析:读写都操作主库,不存在数据一致性问题。

扩展性分析:无法通过增加从库来扩展读性能。

可落地分析:两点影响落地使用。第一,性能一般,这点可以通过建立高效的索引和引入缓存来增加读性能,进而提高性能。这也是通用的方案。第二,扩展性差,这点可以通过分库分表来扩展。

方案二:双主架构,两个主库同时提供服务,负载均衡

jdbc:mysql://vip:3306/xxdb

高可用分析:高可用,一个主库挂了,不影响另一台主库提供服务。这个过程对业务层是透明的,无需修改代码或配置。

高性能分析:读写性能相比于方案一都得到提升,提升一倍。

一致性分析:存在数据一致性问题(主1更新了数据主2读的时候可能还是老的)。请看,一致性解决方案。

扩展性分析:当然可以扩展成三主循环,但不建议(会多一层数据同步,这样同步的时间会更长)。如果非得在数据库架构层面扩展的话,扩展为方案四。

可落地分析:两点影响落地使用。第一,数据一致性问题,一致性解决方案可解决问题。第二,主键冲突问题,ID统一地由分布式ID生成服务来生成可解决问题。

方案三:主从架构,一主多从,读写分离

jdbc:mysql://master-ip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析:主库单点,从库高可用。一旦主库挂了,写服务也就无法提供(优化思路:写库考虑主备,只要有节点在就可以写,读库也是一样的)。

高性能分析:大部分互联网应用读多写少,读会先成为瓶颈,进而影响整体性能。读的性能提高了,整体性能也提高了。另外,主库可以不用索引,线上从库和线下从库也可以建立不同的索引(线上从库如果有多个还是要建立相同的索引,不然得不偿失;线下从库是平时开发人员排查线上问题时查的库,可以建更多的索引)。

一致性分析:存在数据一致性问题(读库时可能写库未完成)。请看,一致性解决方案。

扩展性分析:可以通过加从库来扩展读性能,进而提高整体性能(带来的问题是,从库越多需要从主库拉取binlog日志的端就越多,进而影响主库的性能,并且数据同步完成的时间也会更长。建议不要分多层,且一台主库一般挂3-5台从库吧。一般配置的mysql,并发最好控制在2000/s,挂5台的话,整体基本能支撑1w+/s的并发,再加上缓存和二八定律,基本能支撑小10w/s的并发,很高了。如果还不能满足需求,那还是选择去分库吧。)

可落地分析:两点影响落地使用。第一,数据一致性问题,一致性解决方案可解决问题。第二,主库单点问题,暂时没想到很好的解决方案(这点评论里给了一种方案,可参考)。

注:思考一个问题,一台从库挂了会怎样?读写分离之读的负载均衡策略怎么容错?

方案四:双主+主从架构,看似完美的方案

jdbc:mysql://vip:3306/xxdb

jdbc:mysql://slave1-ip:3306/xxdb

jdbc:mysql://slave2-ip:3306/xxdb

高可用分析:高可用。

高性能分析:高性能。

一致性分析:存在数据一致性问题。请看,一致性解决方案。

扩展性分析:可以通过加从库来扩展读性能,进而提高整体性能。(带来的问题同方案二)

可落地分析:同方案二,但数据同步又多了一层,数据延迟更严重。

三、一致性解决方案

第一类:主库和从库一致性解决方案

注:图中圈出的是数据同步的地方,数据同步(MySQL主从复制,简单来说就是从库从主库拉取binlog日志,再执行一遍,想深入了解可以去查阅“MySQL主从复制原理”相关资料)是需要时间的,这个同步时间内主库和从库的数据会存在不一致的情况。如果同步过程中有读请求,那么读到的就是从库中的老数据,如下图。

既然知道了数据不一致性产生的原因,有下面几个解决方案供参考:

1. 直接忽略,如果业务允许延时存在,那么就不去管它。

2. 强制读主,采用主备架构方案,或者代码指定读主库(一般不建议,这样就失去了读写分离的意义),读写都走主库。

选择读主,写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间(大于等于主从数据同步时间)。读请求时,同样的方式生成key先去查Cache,再判断是否命中。若命中,则读主库,否则读从库。代价是多了一次缓存读写,基本可以忽略。

数据库中间件,引入开源(mycat等)或自研的数据库中间层。个人理解,思路同选择读主。数据库中间件的成本比较高,并且还多引入了一层。

第二类:DB和缓存一致性解决方案

先来看一下常用的缓存使用方式:

第一步:淘汰缓存;

第二步:写入数据库;

第三步:读取缓存?返回:读取数据库;

第四步:读取数据库后写入缓存。

一般来说,并发量不是特别大的话,上面的方式就可以。但是如果是高并发量的情况下,当写入时,你淘汰了缓存,但是还没写入数据库时或者主从延时,就有一个读请求完成了,此时缓存中就会缓存旧的数据。此时可以,写库完成时,等一会(根据业务场景评估)再删除一次缓存,这样缓存旧数据的概率又低了,不过这样一来数据库的压力就会有相应的增加,并且响应时间会增加。其实,要想保证数据库和缓存严格的一致性很难,甚至要付出很高的代价。网上还个方案,就是用本地内存队列来控制读请求和写请求串行化,利弊都有,感兴趣可深入研究:高并发场景下,如何保证缓存和数据库双写的一致性。另外,思考一下是不是能用基于临时顺序节点的Zookeeper分布式锁(用两个锁,一个读锁,一个写锁,当排在写锁后面的第一个读锁被通知时,读操作完成后,批量删除后面连续的读锁,注意不要引发羊群效应 -> 主备架构时)?

个人见解

架构演进,看你所处项目的需要,选择某个方案,方案1 的成本最低,方案2/3/4都存在数据一致性问题,在需要解决数据一致性的前提下个人理解最优方案是基于方案3的演进:1主多从,多个节点间可以选择任意节点为主负责写,剩余节点为备负责读,宕机后仅有1 个节点则读写合一,2个节点则1读1写,3个节点则1写2读,原则:保证1/3的节点为写。

1)  加缓存和索引是通用的提升数据库性能的方式;

2) 分库分表带来的好处是巨大的,但同样也会带来一些问题,详见MySQL数据库之互联网常用分库分表方案

3) 不管是主备+分库分表还是主从+读写分离+分库分表,都要考虑具体的业务场景。一般大部分的数据库架构还是采用方案一和方案一+分库分表,典型的读多写少的场景用方案三+读写分离+分库分表。另外,阿里云提供的数据库云服务也都是主备方案,要想主从+读写分离需要二次架构。

4) 记住一句话:不考虑业务场景的架构都是耍流氓。

互联网常用分库分表

MySQL数据库之互联网常用分库分表方案 - 尜尜人物 - 博客园

何为水平分表和垂直分表,水平分库和垂直分库?什么场景下需要水平分库分表还是垂直分库分表?

不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是,可用数据库连接少甚至无连接可用。接下来就可以想象了吧(并发量、吞吐量、崩溃)。

1、IO瓶颈

第一种:磁盘读IO瓶颈,热点数据太多,数据库缓存放不下,每次查询时会产生大量的IO,降低查询速度 -> 分库和垂直分表。

第二种:网络IO瓶颈,请求的数据太多,网络带宽不够 -> 分库。

2、CPU瓶颈

第一种:SQL问题,如SQL中包含join,group by,order by,非索引字段条件查询等,增加CPU运算的操作 -> SQL优化,建立合适的索引,在业务Service层进行业务计算。

第二种:单表数据量太大,查询时扫描的行太多,SQL效率低,CPU率先出现瓶颈 -> 水平分表。

1、水平分库

概念:以字段为依据,按照一定策略(hash 、 range等),将一个库中的数据拆分到多个库中。

结果:每个库的结构都一样;

每个库的数据都不一样,没有交集;

所有库的并集是全量数据;

场景:系统绝对并发量上来了,分表难以根本上解决问题,并且还没有明显的业务归属来垂直分库。

分析:库多了,io和cpu的压力自然可以成倍缓解。

2、水平分表

概念:以字段为依据,按照一定策略(hash 、range等),将一个表中的数据拆分到多个表中。

结果:每个表的结构都一样;

每个表的数据都不一样,没有交集;

所有表的并集是全量数据;

场景:系统绝对并发量并没有上来,只是单表的数据量太多,影响了SQL效率,加重了CPU负担,以至于成为瓶颈。

分析:表的数据量少了,单次SQL执行效率高,自然减轻了CPU的负担。

3、垂直分库

概念:以表为依据,按照业务归属不同,将不同的表拆分到不同的库中。

结果:每个库的结构都不一样;

每个库的数据也不一样,没有交集;

所有库的并集是全量数据;

场景:系统绝对并发量上来了,并且可以抽象出单独的业务模块。

分析:到这一步,基本上就可以服务化了。例如,随着业务的发展一些公用的配置表、字典表等越来越多,这时可以将这些表拆到单独的库中,甚至可以服务化。再有,随着业务的发展孵化出了一套业务模式,这时可以将相关的表拆到单独的库中,甚至可以服务化。

4、垂直分表

概念:以字段为依据,按照字段的活跃性,将表中字段拆到不同的表(主表和扩展表)中。

结果:每个表的结构都不一样;

每个表的数据也不一样,一般来说,每个表的字段至少有一列交集,一般是主键,用于关联数据;

所有表的并集是全量数据;

场景:系统绝对并发量并没有上来,表的记录并不多,但是字段多,并且热点数据和非热点数据在一起,单行数据所需的存储空间较大。以至于数据库缓存的数据行减少,查询时会去读磁盘数据产生大量的随机读IO,产生IO瓶颈。

分析:可以用列表页和详情页来帮助理解。垂直分表的拆分原则是将热点数据(可能会冗余经常一起查询的数据)放在一起作为主表,非热点数据放在一起作为扩展表。这样更多的热点数据就能被缓存下来,进而减少了随机读IO。拆了之后,要想获得全部数据就需要关联两个表来取数据。但记住,千万别用join,因为join不仅会增加CPU负担并且会讲两个表耦合在一起(必须在一个数据库实例上)。关联数据,应该在业务Service层做文章,分别获取主表和扩展表数据然后用关联字段关联得到全部数据。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266

推荐阅读更多精彩内容