重新投入技术的怀抱中---4.17周技术小结

由于4.17-4.21公司有一个offsite meeting,没有学习到太多技术上的东西,所以今天就把这两周接触到的东西给总结一下。
这一次的内容主要包括两个方面的内容:数据库和Spring Cloud
目录:

1.水平/垂直拆分数据库/表
2.数据库主从/读写分离 简单了解
3.缓存数据库
4.Spring Cloud组件
5.Why Spring Boot
7.RPC协议
8.HTTP请求工具

1.水平/垂直拆分数据库/表

对于数据表:

  • 垂直拆分:
    将对一张表某些与该表关联较弱的字段单独抽取出来,再新建维护一张表。这样可以更好地对每张表进行管理和维护。
    好处:个人理解垂直拆分是对数据库/表设计的一种规范约束

  • 水平拆分
    将一张表的一部分数据提取出来,放到另外的几张表中。
    好处:减少单表数据量,提升查询的性能
    一般常见的做法是对主键或时间等字段进行Hash和取模后拆分。

    水平拆分

对于数据库:

  • 垂直拆分
    由原来单一的、存储各种类型的数据库拆分成有类别独立存储的数据库。
    好处:由于在应用系统中,数据库一般都是充当“拖后腿”的角色,最容易成为整个系统 的性能瓶颈,原因就是因为IO。通过将不同类别的数据进行拆分,存储在不同的数据库中,可以在一定程度上缓解紧张的IO,提升一定的性能。

    垂直拆分

  • 水平拆分:
    一般水平分库和水平分表结合使用,将拆分出来的表保存在不同的数据中。这也是很多大型互联网公司所选择的做法。
    好处:分散数据量,提升查询性能,提高并发量。
    难点:跨库Join问题
    对于此难点的解决方案,从网上总结了一些:

    • 建立全局表
      所谓全局表,就是有可能系统中所有模块都可能会依赖到的一些表。比较类似我们理解的“数据字典”。为了避免跨库join查询,我们可以将这类表在其他每个数据库中均保存一份。同时,这类数据通常也很少发生修改(甚至几乎不会),所以也不用太担心“一致性”问题。
    • 有意设置一些冗余字段
      这是一种典型的反范式设计,在互联网行业中比较常见,通常是为了性能来避免join查询。比如在保留用户外键id的同时,也可以保留一下用户的name,从而可以有效的减少join查询的次数
    • 数据同步
      定时A库中的tab_a表和B库中tbl_b有关联,可以定时将指定的表做同步。当然,同步本来会对数据库带来一定的影响,需要性能影响和数据时效性中取得一个平衡。这样来避免复杂的跨库查询。笔者曾经在项目中是通过ETL工具来实施的。
    • 系统层组装
      在系统层面,通过调用不同模块的组件或者服务,获取到数据并进行字段拼装。说起来很容易,但实践起来可真没有这么简单,尤其是数据库设计上存在问题但又无法轻易调整的时候。

参考文章:分库分表的几种常见形式以及可能遇到的难点

数据库主从/读写分离 简单了解

  • 主从分离
    即master-slave模式,在数据库部署中,有一个master数据库,为我们业务使用的数据库,还有几个slave数据库,需及时同步。这种设计的好处就是提高容灾性。
  • 读写分离
    一部分数据库负责写操作(包含增、改、删操作),一部分数据库直接负责读操作,提高系统并发量,提高性能。不过写数据库的数据要及时同步到读数据库中。

参考文章:数据库主从分离

缓存数据库

通常拿来当做缓存用的数据库有MemcachedRedis

  • Memcached
    • 基于内存的存储
    • 集中式缓存 (集群)
    • 分布式扩展
    • 高性能

其本质基于Key-Value存储

  • Redis:
    • 基于内存存储、计算
    • 支持持久化
    • 支持多种数据结构:String, Map, list, sets等
    • 支持备份(master-slave模式)
    • 高性能
    • 原子操作

参考资料:
1.click here 发现一个有关Memcached的精彩故事
2.About Memcached](https://memcached.org/about)
3.缓存系统MemCached的Java客户端优化历程
4.Memcache,Redis,MongoDB(数据缓存系统)方案对比与分析
5.第1章 初识Redis

4.Spring Cloud组件

  • Eureka
    服务发现中心:Eureka对外提供统一的发现服务功能,对内面向服务,提供注册功能
    启动注解:@EnableEurekaServer
    服务发现注解:@EnableDiscoveryClient,激活Eureka中的DiscoveryClient实现

  • Ribbon
    位于客户端的服务消费组件,具有负载均衡的功能,基于HTTP和TCP。一般和Eureka组合使用,不过也可以单独使用。通过客户端中配置的ribbonServerList服务端列表去轮询访问以达到均衡负载的作用。
    通过@EnableFeignClients注解将某个application声明为Web Service 客户端
    注入RestTemplate,发起请求。请求的地址为SERVER-NAME

  • Feign
    声明式的Web Service客户端,用来消费服务,常与Eureka组合使用。
    通过@EnableFeignClients注解将某个application声明为Web Service 客户端
    通过@FeignClient("SERVICE-NAME")注解在某个接口上,来声明要调用的service,具体的api请求在该接口的方法上用@RequestMapping("API-URL")来标注

  • Hystrix
    Hystrix具备拥有回退机制和断路器功能的线程和信号隔离,请求缓存和请求打包,以及监控和配置等功能。
    通过注解@EnableCircuitBreaker开启某个application的断路器功能。
    通过注解@HystrixCommand的参数fallbackMethod来决定当请求失败之后的回掉函数。

  • Cloud Config
    为服务端和客户端提供了分布式系统的外部化配置支持。
    配置信息的来源一般为git仓库

  • Zuul
    充当api网关,可以将权限控制从micro service中分离出来。

5.Why Spring Boot

目前现在的项目是基于Spring Boot的,感觉用起来很轻松,方便。那么为什么会有Spring Boot的产生呢?它意在解决哪些问题呢?

我通过google找到了一篇国外文章,作者首先是以传统的Spring MVC为例,大致列举了开发一个Spring MVC项目要进行哪些配置,然后再拿出Spring Boot作比较,最后结论不言而喻。

一句话总结Spring Boot的几点好处:

  • 简单、便于管理的maven依赖
  • 自动化的配置(比如根据配置信息自动生成DataSource)
  • 内置的Servlet Container

如果想深入了解具体的细节比较,可以查看这里:Why Spring Boot

7.RPC协议

RPC:Remote Procedure Call Protocol 远程过程调用协议,其流行实现框架有:阿里巴巴的hsf、dubbo(开源)、Facebook的thrift(开源)、Google grpc(开源)、Twitter的finagle(开源)等。

该协议专注于:对于使用者来说,屏蔽底层细节,远程服务调用如同本地调用。

在java中的实现原理:多数动态代理。

有关框架的具体过程介绍和实现,点击查看:你应该知道的RPC原理

8.HTTP请求工具

  • Apache HttpComponent
  • Spring Rest Template
  • okHttp(常用于Android开发)

推荐阅读更多精彩内容