在新建一个Consumer时,我们可以通过指定groupId来将其添加进一个Consumer Group中。Consumer Group是为了实现多个Consumer能够并行的消费一个Topic,并且一个partition只能被一个Consumer Group里的一个固定的Consumer消费。
Consumer Rebalance
对于一个Consumer Group,可能随时都有Consumer加入或者退出这个Consumer Group,Consumer列表的变化势必会引起partition的重新分配。这个为Consumer分配partition的过程就被称为Consumer Rebalance。
出现任何以下的场景都会触发Consumer Rebalance操作:
- 有新的消费者加入Consumer Group。
- 有消费者主动退出Consumer Group。
- Consumer Group订阅的任何一个Topic出现分区数量的变化
- ......
默认情况下,Kafka提供了两种分配策略:Range和RoundRobin。
Range策略
range策略的具体步骤如下:
- 对一个topic中的partition进行排序
- 对消费者按字典进行排序
- 然后遍历排序后的partition的方式分配给消费者
举个例子,比如有两个消费者C0和C1,两个topic(t0,t1),每个topic有三个分区p(0-2),
那么采用Range策略,分配出的结果为:
- C0: [t0p0, t0p1, t1p0, t1p1]
- C1: [t0p2, t1p2]
RoundRobin策略
RoundRobin策略和Range策略类型,唯一的区别就是Range策略分配partition时,是按照topic逐次划分的。而RoundRobin策略则是将所有topic的所有分区一起排序,然后遍历partition分配给消费者。
因此,采用RoundRobin策略,分配出的结果为:
- C0: [t0p0, t0p2, t1p1]
- C1: [t0p1, t1p0, t1p2]
Group Coordinator
Group Coordinator是负责管理Consumer Group的组件。当一个Consumer希望加入某一个Consumer Group时,它会发送一个请求给Group Coordinator。Group Coordinator负责维护一个Consumer Group中所有的Consumer列表,随着Consumer的加入和退出,Coordinator也会随之更新这个列表。
第一个加入Consumer Group的Consumer被称为leader。
一旦Consumer Group中的成员发生变化,例如有新的Consumer加入,那么就需要为其分配partition;或者有Consumer退出,那么就需要将其负责消费的partition分配给组内其他成员。因此Consumer Group中的成员发生变化, Group Coordinator就负责发起Consumer Rebalance活动。
值得注意的是,真正的Consumer Rebalance行为是由Consumer Group Leader执行的。Group Leader首先向Coordinator获取Group中的Consumer成员列表,然后根据Rebalance策略,将partition分配给Consumer Group中的成员,再将分配结果告知Coordinator。最后,Coordinator将partition分配结果通知给每一个Consumer。在Consumer Rebalance的过程中,所有的Consumer都不允许消费消息。
Producer发送消息到Topic时,分配partition的算法如下:
- 如果指定了一个partition,那么直接使用指定的partition
- 如果没有指定partition,但是指定了key,那么会根据key进行哈希,分配到对应的partition中
- 如果partition和key都没指定,会使用round-robin算法进行分配
总结
- Consumer Groups 用于多个Consumer并行消费消息。为了防止两个消费者重复消费一条消息,Kafka不允许同一个Consumer Group中的两个Consumer读取同一个partition。
- Group Coordinator 用于维护Consumer Group信息。
- Consumer Rebalance 是为Consumer Group中的Consumer分配partition的过程。一旦一个Consumer Group中的成员发生变化,就会触发Rebalance行为。
- Group leader 是第一个加入Consumer Group的Consumer,它负责Consumer Rebalance的执行。
- Consumer Rebalance策略主要有Range和Round Robin。