接收消息与ACK机制

添码座原创大约 4 分钟

在知道了发送者的发送和存储机制之后，就可以来看看消费者的接收和消费机制了。

消费者组

组（Group）是对Topic概念的进一步划分，类似于在大主题中再区分出不同的子主题。

当消息从Producer生产者经过Broker发出后，在正常情况下，关注同一个TopicA的两个消费者组stock_consume_group和markting_consume_group都可以接收到这条消息，且在正常情况下，只有其中一台机器能够接收到消息。

也就是说，不管有多少个子系统，每个系统都能够接收到相同Topic发出的消息。但每个子系统不管有多少台机器，始终只有一台机器能够接收到消息。

但如果希望子系统中的每台机器都能够接收到这条消息，那么就需要知道集群模式和广播模式的区别了。

RocketMQ将一个Topic的多个MessageQueue分布在多个Broker上，出于同样的减压策略，它也将同一个MessageQueue均匀地分给消费者组的多台机器来消费。

正如上图显示的一样，理想情况下，应该是以这样理想的方式来消费消息的：每个MessageQueue都有各自的归属。

之前说过两种不同的消息消费模式：Push模式和Pull模式，其实它们本质上都是基于消费者主动发送拉取数据的请求来实现的，只不过在Push模式下，Broker发送消息的时效性更好。

在Push模式下还有消费请求挂起和长轮询的机制。

Broker在收到拉取消息的请求之后，确切地说是某个具体的MessageQueue（例如m0）收到拉取消息的请求之后，它就会找到自己对应的ConsumeQueue（例如c0），然后Broker将根据ConsumeQueue中保存的元信息到CommitLog中去寻找对应的消息数据，并返回给Consumer消费者。
当Consumer消费者消费完拉取到的数据后，会向Broker提交一个消息消费进度，其实就是一个称为ConsumeOffset的元数据。这个提交消息消费进度的过程就称之为ACK。这样，当下次Consumer消费者再执行拉取请求时，Broker就知道从哪个MessageQueue对应的ConsumeQueue的哪个位置去找数据了。

当消费者启动、宕机或者扩容的时候，RocketMQ都会让各个消费者所在的机器执行一次称为Rebalance的过程，它会为消费者重新分配可以处理的MessageQueue。例如，如果上图中的机器4宕机了，那么它之前负责处理的MessageQueue就会被重新分配给机器3；而如果机器4恢复过来，那么之前的MessageQueue可能又会被重新分配给它。虽然在不同的版本中这个Rebalance的执行方式会稍有不同，但负载均衡的思想是一致的。
消费者在拉取数据的时候，Broker会同时从磁盘和Cache中读取数据，具体过程是这样的。
- 先从Cache中读取ConsumeQueue的元信息。
- 然后根据元信息再到Cache中读取CommitLog。
- 最后再从磁盘中读取完整的CommitLog。
如果消费者能够紧跟生产者的步调，那么每次大概率都会从Cache中拿到的数据；反之，如果Broker负载很高，或者消费者处理速率很低，那么拉取到的数据也大概率会是磁盘中的数据。