Kafka Consumer Group和Consumer Rebalance机制

在新建一个Consumer时,我们可以通过指定groupId来将其添加进一个Consumer Group中。Consumer Group是为了实现多个Consumer能够并行的消费一个Topic,并且一个partition只能被一个Consumer Group里的一个固定的Consumer消费。

Consumer Rebalance

对于一个Consumer Group,可能随时都有Consumer加入或者退出这个Consumer Group,Consumer列表的变化势必会引起partition的重新分配。这个为Consumer分配partition的过程就被称为Consumer Rebalance。

出现任何以下的场景都会触发Consumer Rebalance操作:

  • 有新的消费者加入Consumer Group。
  • 有消费者主动退出Consumer Group。
  • Consumer Group订阅的任何一个Topic出现分区数量的变化
  • ......

默认情况下,Kafka提供了两种分配策略:Range和RoundRobin

Range策略

range策略的具体步骤如下:

  1. 对一个topic中的partition进行排序
  2. 对消费者按字典进行排序
  3. 然后遍历排序后的partition的方式分配给消费者

举个例子,比如有两个消费者C0和C1,两个topic(t0,t1),每个topic有三个分区p(0-2),

那么采用Range策略,分配出的结果为:

  • C0: [t0p0, t0p1, t1p0, t1p1]
  • C1: [t0p2, t1p2]

RoundRobin策略

RoundRobin策略和Range策略类型,唯一的区别就是Range策略分配partition时,是按照topic逐次划分的。而RoundRobin策略则是将所有topic的所有分区一起排序,然后遍历partition分配给消费者。

因此,采用RoundRobin策略,分配出的结果为:

  • C0: [t0p0, t0p2, t1p1]
  • C1: [t0p1, t1p0, t1p2]

Group Coordinator

Group Coordinator是负责管理Consumer Group的组件。当一个Consumer希望加入某一个Consumer Group时,它会发送一个请求给Group Coordinator。Group Coordinator负责维护一个Consumer Group中所有的Consumer列表,随着Consumer的加入和退出,Coordinator也会随之更新这个列表。

第一个加入Consumer Group的Consumer被称为leader。

一旦Consumer Group中的成员发生变化,例如有新的Consumer加入,那么就需要为其分配partition;或者有Consumer退出,那么就需要将其负责消费的partition分配给组内其他成员。因此Consumer Group中的成员发生变化, Group Coordinator就负责发起Consumer Rebalance活动。

值得注意的是,真正的Consumer Rebalance行为是由Consumer Group Leader执行的。Group Leader首先向Coordinator获取Group中的Consumer成员列表,然后根据Rebalance策略,将partition分配给Consumer Group中的成员,再将分配结果告知Coordinator。最后,Coordinator将partition分配结果通知给每一个Consumer。在Consumer Rebalance的过程中,所有的Consumer都不允许消费消息。

Producer发送消息到Topic时,分配partition的算法如下:

  1. 如果指定了一个partition,那么直接使用指定的partition
  2. 如果没有指定partition,但是指定了key,那么会根据key进行哈希,分配到对应的partition中
  3. 如果partition和key都没指定,会使用round-robin算法进行分配

总结

  1. Consumer Groups 用于多个Consumer并行消费消息。为了防止两个消费者重复消费一条消息,Kafka不允许同一个Consumer Group中的两个Consumer读取同一个partition。
  2. Group Coordinator 用于维护Consumer Group信息。
  3. Consumer Rebalance 是为Consumer Group中的Consumer分配partition的过程。一旦一个Consumer Group中的成员发生变化,就会触发Rebalance行为。
  4. Group leader 是第一个加入Consumer Group的Consumer,它负责Consumer Rebalance的执行。
  5. Consumer Rebalance策略主要有Range和Round Robin。

参考文章

推荐阅读更多精彩内容