分布式事务实践(三)--Spring的全局事务JTA

01.Spring的本地事务

Spring本身提供了一套Spring容器中进行事务管理的接口:

不同的数据源厂商对Spring提供的事务管理接口都有相应的实现.


0.jpg

而在Spring的容器内,调用者实际上是通过调用Spring的事务接口来实现事务的管理.


1.png

02. 容器内存在多个数据源时

如果一个应用容器中存在多个不同的数据源,通常我们会创建多个数据源的事务管理器.

比如一个Java应用要连数据库,同时也要连接MQ,这种情况下进行事务管理,我们就会创建一个DataSourceTransactionManager和一个JMSTransactionManager分别来对数据库事务和MQ事务进行管理.

在一次请求服务的过程中使用到了2个数据源,那么事务的处理可能是这样的流程:

    public void service {
        // 进行如下操作
        1. start message transaction
        2. receive message
        3. start database transaction
        4. update database
        5. commit database transaction
        // 我出错了
        6. commit messaging transaction
    }

但是在第5步和第6步之间如果出现了异常,那么由于第5步已经提交了,不能进行回滚操作,数据库已经插入了,但是消息还没有被消费掉,这样就无法满足事务的一致性了.

JTA就是用来解决在分布式系统,同时访问多个数据源时,可能出现的数据不一致问题.

03. JTA(Java Transaction Manager)的介绍

3.1 XA与JTA

XA : XA是一个规范或是一个事务的协议.XA协议由Tuxedo首先提出的,并交给X/Open组织,作为资源管理器(数据库)与事务管理器的接口标准.

XA规范定义了:
1. TransactionManager : 这个TransactionManager可以通过管理多个ResourceManager来管理多个Resouce,也就是管理多个数据源
2. XAResource : 针对数据资源封装的一个接口
3. 两段式提交 : 多数据源事务提交的机制

JTA(Java Transaction Manager) : 是Java规范,是XA在Java上的实现.
1. TransactionManager : 常用方法,可以开启,回滚,获取事务. begin(),rollback()...
2. XAResouce : 资源管理,通过Session来进行事务管理,commit(xid)...
3. XID : 每一个事务都分配一个特定的XID

JTA是如何实现多数据源的事务管理呢?

主要的原理是两阶段提交,以上面的请求业务为例,当整个业务完成了之后只是第一阶段提交,在第二阶段提交之前会检查其他所有事务是否已经提交,如果前面出现了错误或是没有提交,那么第二阶段就不会提交,而是直接rollback操作,这样所有的事务都会做Rollback操作.

3.2 JTA的特点

JTA的有点就是能够支持多数据库事务同时事务管理,满足分布式系统中的数据的一致性.但是也有对应的弊端:

  1. 两阶段提交
  2. 事务时间太长,锁数据太长
  3. 低性能,低吞吐量

3.3 JTA的使用

JTA一般有两种使用方式.外部应用服务器提供和依赖Java的库提供.

第一种是外部容器来提供JTA事务支持,通常我们要配合JNDI(Java Naming and Directory Interface,Java命名和目录接口)进行使用.通过JNDI可以调用外部容器中的JTA事务管理器对象实例.并最终通过Spring提供的API来调用事务管理器.

2.png

外部的事务管理器一般是由应用服务器提供,例如JBOSS等.

第二种事务管理器是通过依赖Java的Lib库的方式来提供.我们只需要依赖对应的对应的lib,由Spring来创建JTA事务管理的Bean,这样JTA事务管理器就存在于容器当中,也可以直接使用Spring的API来进行调用.例如Atomikos.

3.png

3.4 JTA的实现(atomikos)

  1. 引入对应的依赖:

         <dependency>
             <groupId>org.springframework.boot</groupId>
             <artifactId>spring-boot-starter-jta-atomikos</artifactId>
         </dependency>
    
  2. 可使用SpringBoot默认配置,引入多个数据源

分别在spring容器中使用spring-data-jpa以及MQ.

7.png
  1. 测试

首先测试无JTA事务情况,注释@Transactional注解:

8.png

测试结果:报byZero错误,mysql中有数据,MQ中无数据,出现数据的不一致性.

然后测试使用JTA进行事物管理,增加@Transactional注册:

9.png

测试结果:报byZero错误,但是mysql和MQ中都没有数据

最后注释错误,进行测试:


10.png

测试结果:没有报错,此时mysql和MQ中都有数据.

4. 总结

JTA可以用于分布式系统中分布式事务的管理.原理是通过两阶段的提交.可以同时管理多个数据源的事务.

XA协议是一套分布式事务管理的规范,JTA是XA协议在Java中的实现,多个数据库或是消息厂商实现JTA接口,开发人员只需要调用SpringJTA接口即可实现JTA事务管理.

但是JTA也有比较严重的性能问题,由于同时操作多个数据源,如果其中一个数据源获取数据的时间过长,会导致整个请求都非常的长,因此现实中对性能要求比较高的系统较少使用JTA事务管理.

常用分布式系统事务管理实现高性能和高吞吐的方式是Spring事务同步机制以及牺牲掉事务的暂时一致性,而保证事务的最终一致性.

比如去年我买高铁票回家的时候,在12306上就遇到了出现数据不一致的问题.

去年我在买高铁票的时候支付了两次才买到票.也就是一个订单需要支付两次才成功.这就是12306的订单系统和支付系统出现了数据不一致的情形.


12.png
11.png

为此我还通过打电话和发邮件的方式找12306的工作人员,但是工作人员告诉我不要着急,如果有多重支付,系统会自动退钱,大概2周后,12306给我退了钱.

这种方式就是在高并发和高吞吐的时候牺牲掉了事务的一致性,并通过定时任务处理错误的提交失败的数据,而保证事务的最终一致性.

代码github地址:https://github.com/lilike/chawuzhi.git

推荐阅读更多精彩内容