RocketMQ 架构简析

RocketMQ 架构简析Apache RocketMQ 是阿里开源的一款高性能、高吞吐量的分布式消息中间件。

整体架构RocketMQ 架构简析

RocketMQ主要由 Producer、Broker、Consumer 三部分组成,其中Producer 负责生产消息,Consumer 负责消费消息,Broker 负责存储消息。每个 Broker 可以存储多个Topic的消息,每个Topic的消息也可以分片存储于集群中的不同的Broker Group。
                                                                                        Namesrv
说道Namesrv首先会想到服务注册与发现。分布式服务SOA架构体系中会有服务注册与发现中心。主要作用是指导服务调用方找到服务提供者提供的服务实例。RocketMQ体系中Namesrv主要作用是:为producer和consumer提供关于topic的路由信息。管理broker节点:监控更新broker的实时状态。路由注册、路由删除(故障剔除)。
Namesrv充当路由消息的提供者。Namesrv是一个几乎无状态节点,多个Namesrv实例组成集群,但相互独立,没有信息交换。
  1. 路由元信息
  • topicQueueTable:topic 消息队列路由信息。
  • brokerAddrTable:broker基础信息。包含broker name,所属集群名称,主broker地址等。
  • clusterAddrTable:broker集群信息,存储集群中所有broker的名称。
  • brokerLiveTable:broker状态信息。
  • filterServerTable:broker上的filterServer列表。filterServer用于消息过滤。
  1. 路由注册  RocketMQ路由注册是通过broker与Namesrv的心跳功能实现的。broker启动时向集群中所有Namesrv发送心跳包,之后每隔30秒向集群中所有Namesrv发送心跳包。心跳包中包含:broker集群信息、broker信息、topic配置信息、broker关联的FilterServer列表等。如果brokerA为Master。并且brokerA上的topic1的配置信息发生变化或初次注册,Namesrv会根据报文创建或更新Topic路由元数据,填充topicQueueTable。
  2. 路由删除  Namesrv收到brokerA的心跳包会更新brokerLiveTable中的brokerA对应的BrokerLiveInfo中的lastUpdateTimestamp。Namesrv每隔10秒扫描brokerLiveTable一次。如果brokerA对应的BrokerLiveInfo 中 lastUpdateTimestamp距当前时间超过 120秒,Namesrv认为brokerA失效,会将brokerA的路由信息移除并关闭与broker的socket连接。更新:topicQueueInfo、brokerAddrTable、brokerLiveTable、filterServerTable等。
  3. 路由发现  RocketMQ路由发现是非实时的。当Topic路由信息发生变化是,Namesrv不会主动推送给客户端(Producer、Consumer)。而是由客户端定时到Namesrv拉去最新的路由信息并缓存(包含Topic路由信息)。

与kafka对比
kafka 由zookeeper集群提供命名服务(Naming Service)。
Kafka通过 ZooKeeper 管理集群配置、选举 Leader 以及在 consumer g

Broker

消息中转角色,负责存储消息、转发消息。代理服务器在RocketMQ系统中负责接收从生产者发送来的消息并存储、同时为消费者的拉取请求作准备。代理服务器也存储消息相关的元数据,包括消费者组、消费进度偏移和主题和队列消息等。
Broker是以group为单位提供服务。一个group里面分Master和Slave。Master和Slave存储的数据一样,slave从master同步数据(同步双写或异步复制看配置)。一个Master可以对应多个Slave,一个Slave只能对应一个Master。Master与Slave的对应关系通过指定相同的BrokerName、不同的BrokerId来定义,BrokerId为0表示Master,非0表示Slave。Master也可以部署多个。broker不必须是物理机或虚拟机:
RocketMQ 架构简析
每个Broker与Namesrv集群中的所有节点建立长连接,定时发送心跳包到所有Namesrv,更新broker信息、topic路由信息等。一个Topic的不同queue(分区)可分布到集群中不同的broker group上。
与kafka对比:
kafka和RocketMQ的broker都可以容纳多个一个或多个分区数据(kafka分区:partition;RocketMQ分区:queue)。
kafka基于partition(分区) 做备份/高可用(partition follower)。
RocketMQ增加了broker group的概念,基于broker(可能包含多个分区)。
                                                                                   Producer
(消息)生产者。Producer与Namesrv集群中的其中一个节点(随机选择)建立长连接,定期从Name Server取Topic路由信息,并向提供Topic服务的broker master建立长连接,且定时向broker master发送心跳。Producer完全无状态,可集群部署。
Producer负责生产消息,一般由业务系统负责生产消息。一个消息生产者会把业务应用系统里产生的消息发送到broker服务器。RocketMQ提供多种发送方式,同步发送、异步发送、顺序发送、单向发送。同步和异步方式均需要Broker返回确认信息,单向发送不需要。
                                                                                     Consumer
(消息)消费者 Consumer与Namesrv集群中的其中一个节点(随机选择)建立长连接,定期从Name Server取Topic路由信息,并向提供Topic服务的Master、Slave建立长连接,且定时向Master、Slave发送心跳。Consumer既可以从Master订阅消息,也可以从Slave订阅消息,订阅规则由Broker配置决定。
Consumer负责消费消息,一般是后台系统负责异步消费。一个消息消费者会从Broker服务器拉取消息、并将其提供给应用程序。从用户应用的角度而言提供了两种消费形式:拉取式消费、推动式消费。
集群模式下:相同Consumer Group的每个Consumer实例平均分摊消息。一个条消息仅能被一个Consumer Group消费一次。、
Producer、Consumer都只需要和集群中一个Namesrv建立长连接。Broker需要向集群中所有的Namesrv发送心跳包。
其实很好理解:
Namesrv集群提供高可用的命名服务。
Producer、Consumer只需要从其中一台定期同步路由信息。
如果Broker只随机调一台发送心跳包。那么不同的Namesrv保存的路由信息会出现

消费者类型:

  1. 拉取式消费(Pull Consumer) Consumer消费的一种类型,应用通常主动调用Consumer的拉消息方法从Broker服务器拉消息、主动权由应用控制。一旦获取了批量消息,应用就会启动消费过程。Pull方式里,取消息的过程需要用户自己写(包括提交offset等操作)。
  2. 推动式消费(Push Consumer) Consumer消费的一种类型,该模式下Broker收到数据后会主动推送给消费端,该消费模式一般实时性较高。Push Consumer原理上也是采取pull模式。实际上就是长轮询的pull模式。

一些概念

  • 主题(Topic) 表示一类消息的集合,每个主题包含若干条消息,每条消息只能属于一个主题,是RocketMQ进行消息订阅的基本单位。每个topic可分为若干个分区(queue)。
  • 生产者组(Producer Group) 同一类Producer的集合,这类Producer发送同一类消息且发送逻辑一致。如果发送的是事务消息且原始生产者在发送之后崩溃,则Broker服务器会联系同一生产者组的其他生产者实例以提交或回溯消费。
  • 消费者组(Consumer Group) 同一类Consumer的集合,这类Consumer通常消费同一类消息且消费逻辑一致。消费者组使得在消息消费方面,实现负载均衡和容错的目标变得非常容易。要注意的是,消费者组的消费者实例必须订阅完全相同的Topic。RocketMQ 支持两种消息模式:集群消费(Clustering)和广播消费(Broadcasting)。
  • 普通顺序消息(Normal Ordered Message) 普通顺序消费模式下,消费者通过同一个消费队列收到的消息是有顺序的,不同消息队列收到的消息则可能是无顺序的。
  • 严格顺序消息(Strictly Ordered Message) 严格顺序消息模式下,消费者收到的所有消息均是有顺序的。
  • 消息(Message) 消息系统所传输信息的物理载体,生产和消费数据的最小单位,每条消息必须属于一个主题。RocketMQ中每个消息拥有唯一的Message ID,且可以携带具有业务标识的Key。系统提供了通过Message ID和Key查询消息的功能。
  • 标签(Tag) 为消息设置的标志,用于同一主题下区分不同类型的消息。来自同一业务单元的消息,可以根据不同业务目的在同一主题下设置不同标签。标签能够有效地保持代码的清晰度和连贯性,并优化RocketMQ提供的查询系统。消费者可以根据Tag实现对不同子主题的不同消费逻辑,实现更好的扩展性。

关于消息中间件

消息中间件需要解决的问题:异步化、削峰填谷。
消息中间件应具备的基础能力是:消息发布、订阅、消费。概念相对简单这里不过多描述。
消息中间件的一些重要的机制:

1. 消息优先级(Message Priority;RocketMQ不支持)

优先级是指在一个消息队列中,每条消息都有不同的优先级,一般用整数来描述,优先级高的消息先投递,如果消息完全在一个内存队列中,那么在投递前可以按照优先级排序,令优先级高的先投递。由于RocketMQ所有消息都是持久化的,所以如果按照优先级来排序,开销会非常大,因此RocketMQ没有特意支持消息优先级,但是可以通过变通的方式实现类似功能,即单独配置一个优先级高的队列,和一个普通优先级的队列,将不同优先级发送到不同队列即可。

2. 顺序消息(Message Order)

消息有序指的是一类消息消费时,能按照发送的顺序来消费。例如:一个订单产生了3条消息,分别是订单创建,订单付款,订单完成。消费时,要按照这个顺序消费才能有意义。但是同时订单之间是可以并行消费的。RocketMQ可以严格的保证消息有序。
  • 投递消息的顺序性:投递消息的顺序性可通过将一组消息投递到同一分区实现。例如:借助MessageQueueSelector将对相同订单的操作消息投放到同一分区。
  • 消费消息的顺序性:RoctetMQ特性保障:特定分区(queue)中的消息不能同时被同一个消费者组中的多个Consumer消费,以避免重复消费。通过自定义或使用预置的AllocateQueueStrategy可设定分区的分配策略(哪些分区分配给哪个消费者消费)。

3. 高可用、消息可靠性

3.1 消息持久化

RocketMQ、Kafka 以文件记录形式持久化。
RocketMQ采用了单一的日志文件,即把同1个broker上面所有topic的所有queue的消息,存放在一个文件里面,从而避免了随机的磁盘写入。
RocketMQ 架构简析
如上图所示,所有消息都存在一个单一的CommitLog文件里面,然后有后台线程异步的同步到ConsumeQueue,再由Consumer进行消费。
TODO 同步、异步刷盘。RocketMQ 架构简析
TODO RocketMQ充分利用Linux文件系统内存cache来提高性能。TODO CommitLog index Commitlog segment的大小与页缓存一致。
RocketMQ消息存储机制会在后面的文章详细说明。

3.2 broker master/salve

TODO broker group master/salve
TODO Async/Sync Master;

4. 高并发、可扩展 ==> 分布式

提高并发效率 => 提高生产、消费并行度=>提高分区数量。
RocketMQ、kafka都支持topic数据分区存放、动态扩展。
以RocketMQ为例:
topic创建的时候可以用集群模式去创建(这样集群里面每个broker的queue的数量相同),也可以用单个broker模式去创建(这样每个broker的queue数量可以不一致)。

4.1 生产并行度

RocketMQ的生产并行度是由其自身机制及broker的数量决定的。这块后面的文章会详细分析。

4.2 消费并行度

广播模式下所有消费者会接受并消费当前topic下所有Queue的消息。
集群模式下,一个queue只分配给一个consumer实例:这是由于拉取消息是consumer主动控制的,如果多个实例同时消费一个queue的消息,会导致同一个消息在不同的实例下被消费多次,所以算法上都是一个queue只分给一个consumer实例,一个consumer实例可以允许同时分到不同的queue。
Kafka的消费并行度依赖Topic配置的分区数,如分区数为10,那么最多10台机器来并行消费(每台机器只能开启一个线程),或者一台机器消费(10个线程并行消费)。即消费并行度和分区数一致。RocketMQ消费并行度分两种情况:顺序消费方式并行度同卡夫卡完全一致;乱序方式并行度取决于Consumer的线程数,如Topic配置10个队列,10台机器消费,每台机器100个线程,那么并行度为1000。

4.3 消息队列分配策略

Producer使用MessageQueueSelector选择将消息投放到哪个分区 使用AllocateMessageQueueStrategy将不同分区分配给Consumer Group中的不同Consumer。一个分区(queue)仅允许分配给同一个Consumer Group下的一个Consumer(防止重复消费)。
MessageQueueSelector

RocketMQ 架构简析
内置实现类:SelectMessageQueueByMachineRoom SelectMessageQueueByHash SelectMessageQueueByRandom
可以通过实现MessageQueueSelector接口,来自定义Producer投递消息时选择分区的算法。
AllocateMessageQueueStrategy

RocketMQ 架构简析
内置实现类:
AllocateMessageQueueAveragely:平均分配算法 
AllocateMessageQueueAveragelyByCircle:基于环形平均分配算法
AllocateMachineRoomNearby:基于机房临近原则算法
AllocateMessageQueueByMachineRoom:基于机房分配算法
AllocateMessageQueueConsistentHash:基于一致性hash算法
AllocateMessageQueueByConfig:基于配置分配算法
可以通过实现AllocateMessageQueueStrategy来自定义queue 分配给特定Consumer Group下不同Consumer的策略。

参考:

https://github.com/apache/rocketmq/blob/master/docs/cn/
https://juejin.im/post/6844903589819875336
https://jaskey.github.io/blog/2016/12/19/rocketmq-rebalance/
http://objcoding.com/2019/09/13/kafka-partition-and-rmq-queue/
http://www.itmuch.com/books/rocketmq
作者:RyanLee86799来源:https://juejin.im/post/6844904130822029320

文章转载:JAVA高级架构

(版权归原作者所有,侵删)

相关新闻

历经多年发展,已成为国内好评如潮的Linux云计算运维、SRE、Devops、网络安全、云原生、Go、Python开发专业人才培训机构!