×

初识Open/X XA

96
john_zhong
2017.05.14 11:36* 字数 2111

初识Open/X XA

XA是DTP的一部分接口规范。

Distributed Transaction Processing(DTP)

DTP是一种实现分布式事务处理系统的概念模型,OSI和Open/X都有正式文档来定义它:

  • X/Open Guide, Distributed Transaction Processing Reference Model, X/Open Company Ltd., October 1991.
  • The ISO/IEC Open Systems Interconnection (OSI) Distributed Transaction Processing (DTP) standard.
  • ISO/IEC DIS 10026-1 (1991) (model)
  • ISO/IEC DIS 10026-2 (1991) (service)
  • ISO/IEC DIS 10026-3 (1991) (protocol)

为了简化理解,我们只考虑它的静态结构。在DTP的经典结构图(下图)中,整套系统由三种角色构成。

DTP diagram
  • 应用程序(Application Program,AP)

    这个角色要做两件事情,一方面是定义构成整个事务所需要的所有操作,另一方面是亲自访问资源节点来执行操作。

The AP defines ** transactions ** and accesses ** resources **
within transaction boundaries.

  • 资源管理器(Resource Managers,RM)

    这个角色是管理着某些共享资源的自治域,比如说一个MySQL数据库实例。在DTP里面,还有两个要求,一是RM自身必须是支持事务的,二是RM能够根据
    将全局(分布式)事务标识定位到自己内部的对应事务。

Every RM in the DTP environment must support transactions as
described in Section 2.2.1 on page 4
An RM is responsible for mapping its recoverable units of work to
the global transaction

  • 事务管理器(Transaction Manager,TM)

    这个角色能与AP和RM直接通信,协调AP和RM来实现分布式事务的完整性。主要的工作是提供AP注册全局事务的接口,颁发全局事务标识(GTID之类 的),存储/管理全局事务的内容和决策并指挥RM做commit/rollback。

XA在哪里?XA是RM和TM的交互规范和接口定义

eXtended Architecture(XA)

TM和RM们之间使用的是上文提到的《ISO/TEC DIS 10026-1 (1991) (model)》所定义的二阶段提交。在XA规范的描述中,两阶段提交TM协调RM们完成已定义的全局事务的方法,AP找TM申请/注册全局事务的动作并不是二阶段提交的保障内容。

二阶段提交(two-phase commit)

对于单个全局(分布式)事务,在DTP环境中,二阶段提交流程大致如下:

  1. 第一阶段(Phase 1)

TM请求所有RM进行准备(prepare commit, or prepare),并告知它们各自需要做的局部事务(transaction branche)。RM收到请求后,如果判断可以完成自己的局部事务,那就持久化局部事务的工作内容,再给TM肯定答复;要是发生了其他情况,那给TM的都是否定答复。在发送了否定答复并回滚了局部事务之后,RM才能丢弃持久化了的局部事务信息。

  1. 第二阶段(Phase 2)

TM根据情况(比如说所有RM都prepare成功,或者,AP通知它要rollback等),先持久化它对这个全局事务的处理决定和所涉及的RM清单,然后通知所有涉及的RM去提交(commit)或者回滚(rollback)它们的局部事务。RM们处理完自己的局部事务后,将返回值告诉TM之后,TM才可以清除掉包括刚才持久化的处理决定和RM清单在内的这个全局事务的信息。

两阶段提交的协议层面优化

  • 只读断言

    在Phase 1中,RM可以断言“我这边不涉及数据增删改”来答复TM的prepare请求,从而让这个RM脱离当前的全局事务,从而免去了Phase 2。

    这种优化发生在其他RM都完成prepare之前的话,使用了只读断言的RM早于AP其他动作(比如说这个RM返回那些只读数据给AP)前,就释放了相关数据的上下文(比如读锁之类的),这时候其他全局事务或者本地事务就有机会去改变这些数据,结果就是无法保障整个系统的可序列化特性——通俗点说那就会有脏读的风险。

  • 一阶段提交(one-phase commit)

    如果需要增删改的数据都在同一个RM上,TM可以使用一阶段提交——跳过两阶段提交中的Phase 1,直接执行Phase 2。

    但这种优化的本质是跳过Phase 1,这种情况下,RM自行决定了整个局部事务的结果,并且在答复TM前就清除掉局部事务(因为Phase 2中RM应答完请求后,TM就没有必要去联系它了),这样TM就没有必要去持久化使用了这种优化的全局事务,也导致在某些系统故障(比如说由于网络通信抖动,TM没收到RM的回复)时,TM可能会完全不知道这类事务的执行结果。

使用X/Open XA接口描述的二阶段提交

X/Open的XA接口分为两类:

  • 一类是ax_开头的,只有ax_reg()和ax_unreg()两个,由TM提供给RM调用,从而支撑起RM加入/退出集群时的动态注册机制

  • 另一类是xa_开头的,由RM提供给TM调用,用于实现二阶段提交中的各种事务提交、恢复功能

    下面是使用这些接口来描述的二阶段提交的一个流程示意图:

Descript 2PC with XA interface
  1. 在开始一个全局事务之前,涉及的RM必须通过ax_regr(),向TM注册以加入集群;对应的,在没有事务需要处理的时候,RM可以通过ax_unreg()向TM要求注销,离开集群。

  2. TM在对一个RM执行xa_开头的具体操作前,必须先通过xa_open()打开这个RM(本质是建立对话)——这其实也是分配XID的一个行为;与之相应的,TM执行xa_close()来关闭RM。

  3. TM对RM调用的xa_start()和xa_stop()这对组合,一般用于标记局部事务的开头和结尾。这里需要注意的有三点:

  4. 对于同一个RM,根据全局事务的要求,可以前后执行多对组合——俾如说,先标记一个流水账INSERT的局部事务操作,然后再标记账户UPDATE的局部事务操作。

  5. TM执行该组合只是起到标记事务的作用,具体的业务命令是由AP交给RM的。

  6. 该组合除了执行这些标记工作外,其实还能在RM中实现多线程的join/suspend/resume管理。

  7. TM调用RM的xa_prepare()来进行第一阶段,调用xa_commit()或xa_rollback()执行第二阶段。

XA接口清单

规范中使用ISO C描述了一个xa.h的头文件,给出了XA接口的定义。

  • ax_XXX接口

  • ax_reg
    向一个TM注册一个RM

  • ax_unreg
    向一个TM注销一个RM

  • xa_XXX接口

  • xa_close
    停止当前AP对某个RM的使用

  • xa_commit
    通知RM去提交局部事务(第二阶段)

  • xa_complete
    询问指定的异步xa_操作是否完成

  • xa_end
    解除线程与局部事务的关联

  • xa_forget
    RM存在一种优化方式,就是在第一阶段进行先行完成(heuristiccally complete)局部事务,从而尽早释放资源(如释放锁等),但保留局部事务回滚能力与全局事务的对应关系等事务元数据;如果全局事务成功的话,TM通过这个接口许可RM废弃这个事务的事务元数据

  • xa_open
    初始化某个RM给当前AP使用

  • xa_prepare
    通知目标RM进行第一阶段工作

  • xa_recover
    获取指定RM上已完成了第一阶段或者先行完成的XID清单

  • xa_rollback
    通知指定RM回滚指定的局部事务

  • xa_start
    启动或恢复RM上的局部事务,换句话说,TM告诉这个RM,它后面的工作都与它现在给的XID相关。

参考

Distributed Transaction Processing: The XA Specification

基础理论学习
Web note ad 1