RocketMQ消息短暂而又精彩的一生

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

核心概念

NameServer可以理解为是一个注册中心主要是用来保存topic路由信息管理Broker。在NameServer的集群中NameServer与NameServer之间是没有任何通信的。
Broker核心的一个角色主要是用来保存消息的在启动时会向NameServer进行注册。Broker实例可以有很多个相同的BrokerName可以称为一个Broker组每个Broker组只保存一部分消息。
topic可以理解为一个消息的集合的名字一个topic可以分布在不同的Broker组下。
队列queue 一个topic可以有很多队列默认是一个topic在同一个Broker组中是4个。如果一个topic现在在2个Broker组中那么就有可能有8个队列。
生产者生产消息的一方就是生产者
生产者组一个生产者组可以有很多生产者只需要在创建生产者的时候指定生产者组那么这个生产者就在那个生产者组
消费者用来消费生产者消息的一方
消费者组跟生产者一样每个消费者都有所在的消费者组一个消费者组可以有很多的消费者不同的消费者组消费消息是互不影响的。

消息诞生与发送

我们都知道消息是由业务系统在运行过程产生的当我们的业务系统产生了消息我们就可以调用RocketMQ提供的API向RocketMQ发送消息就像下面这样

DefaultMQProducer producer = new DefaultMQProducer("sanyouProducer");
//指定NameServer的地址
producer.setNamesrvAddr("localhost:9876");
//启动生产者
producer.start();
//省略代码。。
Message msg = new Message("sanyouTopic", "TagA", "三友的java日记 ".getBytes(RemotingHelper.DEFAULT_CHARSET));
// 发送消息并得到消息的发送结果然后打印
SendResult sendResult = producer.send(msg);
复制代码

虽然代码很简单我们不经意间可能会思考如下问题

代码中只设置了NameServer的地址那么生产者是如何知道Broker所在机器的地址然后向Broker发送消息的
一个topic会有很多队列那么生产者是如何选择哪个队列发送消息
消息一旦发送失败了怎么办

路由表

当Broker在启动的过程中Broker就会往NameServer注册自己这个Broker的信息这些信息就包括自身所在服务器的ip和端口还有就是自己这个Broker有哪些topic和对应的队列信息这些信息就是路由信息后面就统一称为路由表。

Broker向NameServer注册

当生产者启动的时候会从NameServer中拉取到路由表缓存到本地同时会开启一个定时任务默认是每隔30s从NameServer中重新拉取路由信息更新本地缓存。

队列的选择

好了通过上一节我们就明白了原来生产者会从NameServer拉取到Broker的路由表的信息这样生产者就知道了topic对应的队列的信息了。

但是由于一个topic可能会有很多的队列那么应该将消息发送到哪个队列上呢

面对这种情况RocketMQ提供了两种消息队列的选择算法。

轮询算法
最小投递延迟算法

轮询算法 就是一个队列一个队列发送消息这些就能保证消息能够均匀分布在不同的队列底下这也是RocketMQ默认的队列选择算法。

但是由于机器性能或者其它情况可能会出现某些Broker上的Queue可能投递延迟较严重这样就会导致生产者不能及时发消息造成生产者压力过大的问题。所以RocketMQ提供了最小投递延迟算法。

最小投递延迟算法 每次消息投递的时候会统计投递的时间延迟在选择队列的时候会优先选择投递延迟时间小的队列。这种算法可能会导致消息分布不均匀的问题。

如果你想启用最小投递延迟算法只需要按如下方法设置一下即可。

producer.setSendLatencyFaultEnable(true);
复制代码

当然除了上述两种队列选择算法之外你也可以自定义队列选择算法只需要实现MessageQueueSelector接口在发送消息的时候指定即可。

SendResult sendResult = producer.send(msg, new MessageQueueSelector() {
    @Override
    public MessageQueue select(List<MessageQueue> mqs, Message msg, Object arg) {
        //从mqs中选择一个队列
        return null;
    }
}, new Object());
复制代码

MessageQueueSelector RocketMQ也提供了三种实现

随机算法
Hash算法
根据机房选择算法空实现

其它特殊情况处理

发送异常处理

终于不论是通过RocketMQ默认的队列选择算法也好又或是自定义队列选择算法也罢终于选择到了一个队列那么此时就可以跟这个队列所在的Broker机器建立网络连接然后通过网络请求将消息发送到Broker上。

但是不幸的事发生了Broker挂了又或者是机器负载太高了发送消息超时了那么此时RockerMQ就会进行重试。

RockerMQ重试其实很简单就是重新选择其它Broker机器中的一个队列进行消息发送默认会重试两次。

当然如果你的机器比较多可以将设置重试次数设置大点。

producer.setRetryTimesWhenSendFailed(10);
复制代码

消息过大的处理

一般情况下消息的内容都不会太大但是在一些特殊的场景中消息内容可能会出现很大的情况。

遇到这种消息过大的情况比如在默认情况下消息大小超过4M的时候RocketMQ是会对消息进行压缩之后再发送到Broker上这样在消息发送的时候就可以减少网络资源的占用。

消息存储

好了经过以上环节Broker终于成功接收到了生产者发送的消息了但是为了能够保证Broker重启之后消息也不丢失此时就需要将消息持久化到磁盘。

如何保证高性能读写

由于涉及到消息持久化操作就涉及到磁盘数据的读写操作那么如何实现文件的高性能读写呢这里就不得不提到的一个叫零拷贝的技术。

传统IO读写方式

说零拷贝之前先说一下传统的IO读写方式。

比如现在需要将磁盘文件通过网络传输出去那么整个传统的IO读写模型如下图所示

传统的IO读写其实就是read + write的操作整个过程会分为如下几步

用户调用read()方法开始读取数据此时发生一次上下文从用户态到内核态的切换也就是图示的切换1
将磁盘数据通过DMA拷贝到内核缓存区
将内核缓存区的数据拷贝到用户缓冲区这样用户也就是我们写的代码就能拿到文件的数据
read()方法返回此时就会从内核态切换到用户态也就是图示的切换2
当我们拿到数据之后就可以调用write()方法此时上下文会从用户态切换到内核态即图示切换3
CPU将用户缓冲区的数据拷贝到Socket缓冲区
将Socket缓冲区数据拷贝至网卡
write()方法返回上下文重新从内核态切换到用户态即图示切换4

整个过程发生了4次上下文切换和4次数据的拷贝这在高并发场景下肯定会严重影响读写性能。

所以为了减少上下文切换次数和数据拷贝次数就引入了零拷贝技术。

零拷贝

零拷贝技术是一个思想指的是指计算机执行操作时CPU不需要先将数据从某处内存复制到另一个特定区域。

实现零拷贝的有以下几种方式

mmap()
sendfile()

mmap()

mmapmemory map是一种内存映射文件的方法即将一个文件或者其它对象映射到进程的地址空间实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。

简单地说就是内核缓冲区和应用缓冲区共享从而减少了从读缓冲区到用户缓冲区的一次CPU拷贝。

比如基于mmap上述的IO读写模型就可以变成这样。

基于mmap IO读写其实就变成mmap + write的操作也就是用mmap替代传统IO中的read操作。

当用户发起mmap调用的时候会发生上下文切换1进行内存映射然后数据被拷贝到内核缓冲区mmap返回发生上下文切换2随后用户调用write发生上下文切换3将内核缓冲区的数据拷贝到Socket缓冲区write返回发生上下文切换4。

整个过程相比于传统IO主要是不用将内核缓冲区的数据拷贝到用户缓冲区而是直接将数据拷贝到Socket缓冲区。上下文切换的次数仍然是4次但是拷贝次数只有3次少了一次CPU拷贝。

在Java中提供了相应的api可以实现mmap当然底层也还是调用Linux系统的mmap()实现的

FileChannel fileChannel = new RandomAccessFile("test.txt", "rw").getChannel();
MappedByteBuffer mappedByteBuffer = fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, fileChannel.size());
复制代码

如上代码拿到MappedByteBuffer之后就可以基于MappedByteBuffer去读写。

sendfile()

sendfile()跟mmap()一样也会减少一次CPU拷贝但是它同时也会减少两次上下文切换。

如图用户发起sendfile()调用时会发生切换1之后数据通过DMA拷贝到内核缓冲区之后再将内核缓冲区的数据CPU拷贝到Socket缓冲区最后拷贝到网卡sendfile()返回发生切换2。

同样地Java也提供了相应的api底层还是操作系统的sendfile()

FileChannel channel = FileChannel.open(Paths.get("./test.txt"), StandardOpenOption.WRITE, StandardOpenOption.CREATE);
//调用transferTo方法向目标数据传输
channel.transferTo(position, len, target);
复制代码

通过FileChannel的transferTo方法即可实现。

transferTo方法sendfile主要是用于文件传输比如将文件传输到另一个文件又或者是网络。

在如上代码中并没有文件的读写操作而是直接将文件的数据传输到target目标缓冲区也就是说sendfile是无法知道文件的具体的数据的但是mmap不一样他是可以修改内核缓冲区的数据的。假设如果需要对文件的内容进行修改之后再传输只有mmap可以满足。

通过上面的一些介绍主要就是一个结论那就是基于零拷贝技术可以减少CPU的拷贝次数和上下文切换次数从而可以实现文件高效的读写操作。

RocketMQ内部主要是使用基于mmap实现的零拷贝(其实就是调用上述提到的api)用来读写文件这也是RocketMQ为什么快的一个很重要原因。

RocketMQ中使用mmap代码

CommitLog

前面提到消息需要持久化到磁盘文件中而CommitLog其实就是存储消息的文件的一个称呼所有的消息都存在CommitLog中一个Broker实例只有一个CommitLog。

由于消息数据可能会很大同时兼顾内存映射的效率不可能将所有消息都写到同一个文件中所以CommitLog在物理磁盘文件上被分为多个磁盘文件每个文件默认的固定大小是1G。

当生产者将消息发送过来的时候就会将消息按照顺序写到文件中当文件空间不足时就会重新建一个新的文件消息写到新的文件中。

消息在写入到文件时不仅仅会包含消息本身的数据也会包含其它的对消息进行描述的数据比如这个消息来自哪台机器、消息是哪个topic的、消息的长度等等这些数据会和消息本身按照一定的顺序同时写到文件中所以图示的消息其实是包含消息的描述信息的。

刷盘机制

RocketMQ在将消息写到CommitLog文件中时并不是直接就写到文件中而是先写到PageCache也就是前面说的内核缓存区所以RocketMQ提供了两种刷盘机制来将内核缓存区的数据刷到磁盘。

异步刷盘

异步刷盘就是指Broker将消息写到PageCache的时候就直接返回给生产者说消息存储成功了然后通过另一个后台线程来将消息刷到磁盘这个后台线程是在RokcetMQ启动的时候就会开启。异步刷盘方式也是RocketMQ默认的刷盘方式。

其实RocketMQ的异步刷盘也有两种不同的方式一种是固定时间默认是每隔0.5s就会刷一次盘另一种就是频率会快点就是每存一次消息就会通知去刷盘但不会去等待刷盘的结果同时如果0.5s内没被通知去刷盘也会主动去刷一次盘。默认的是第一种固定时间的方式。

同步刷盘

同步刷盘就是指Broker将消息写到PageCache的时候会等待异步线程将消息成功刷到磁盘之后再返回给生产者说消息存储成功。

同步刷盘相对于异步刷盘来说消息的可靠性更高因为异步刷盘可能出现消息并没有成功刷到磁盘时机器就宕机的情况此时消息就丢了但是同步刷盘需要等待消息刷到磁盘那么相比异步刷盘吞吐量会降低。所以同步刷盘适合那种对数据可靠性要求高的场景。

如果你需要使用同步刷盘机制只需要在配置文件指定一下刷盘机制即可。

高可用

在说高可用之前先来完善一下前面的一些概念。

在前面介绍概念的时候也说过一个RokcetMQ中可以有很多个Broker实例相同的BrokerName称为一个组同一个Broker组下每个Broker实例保存的消息是一样的不同的Broker组保存的消息是不一样的。

如图所示两个BrokerA实例组成了一个Broker组两个BrokerB实例也组成了一个Broker组。

前面说过每个Broker实例都有一个CommitLog文件来存储消息的。那么两个BrokerA实例他们CommitLog文件存储的消息是一样的两个BrokerB实例他们CommitLog文件存储的消息也是一样的。

那么BrokerA和BrokerB存的消息不一样是什么意思呢

其实很容易理解假设现在有个topicA存在BrokerA和BrokerB上那么topicA在BrokerA和BrokerB默认都会有4个队列。

前面在说发消息的时候需要选择一个队列进行消息的发送假设第一次选择了BrokerA上的队列发送消息那么此时这条消息就存在BrokerA上假设第二次选择了BrokerB上的队列发送消息那么那么此时这条消息就存在BrokerB上所以说BrokerA和BrokerB存的消息是不一样的。

那么为什么同一个Broker组内的Broker存储的消息是一样的呢其实比较容易猜到就是为了保证Broker的高可用这样就算Broker组中的某个Broker挂了这个Broker组依然可以对外提供服务。

那么如何实现同Broker组的Broker存的消息数据相同的呢这就不得不提到Broker的高可用模式。

RocketMQ提供了两种Broker的高可用模式

主从同步模式
Dledger模式

主从同步模式

在主从同步模式下在启动的时候需要在配置文件中指定BrokerId在同一个Broker组中BrokerId为0的是主节点master其余为从节点(slave)。

当生产者将消息写入到主节点是主节点会将消息内容同步到从节点机器上这样一旦主节点宕机从节点机器依然可以提供服务。

主从同步主要同步两部分数据

topic等数据
消息

topic等数据是从节点每隔10s钟主动去主节点拉取然后更新本身缓存的数据。

消息是主节点主动推送到从节点的。当主节点收到消息之后会将消息通过两者之间建立的网络连接发送出去从节点接收到消息之后写到CommitLog即可。

从节点有两种方式知道主节点所在服务器的地址第一种就是在配置文件指定第二种就是从节点在注册到NameServer的时候会返回主节点的地址。

主从同步模式有一个比较严重的问题就是如果集群中的主节点挂了这时需要人为进行干预手动进行重启或者切换操作而非集群自己从从节点中选择一个节点升级为主节点。

为了解决上述的问题所以RocketMQ在4.5.0就引入了Dledger模式。

Dledger模式

在Dledger模式下的集群会基于Raft协议选出一个节点作为leader节点当leader节点挂了后会从follower中自动选出一个节点升级成为leader节点。所以Dledger模式解决了主从模式下无法自动选择主节点的问题。

在Dledger集群中leader节点负责写入消息当消息写入leader节点之后leader会将消息同步到follower节点当集群中过半数(节点数/2 +1)节点都成功写入了消息这条消息才算真正写成功。

至于选举的细节这里就不多说了有兴趣的可以自行谷歌还是挺有意思的。

消息消费

终于在生产者成功发送消息到BrokerBroker在成功存储消息之后消费者要消费消息了。

消费者在启动的时候会从NameSrever拉取消费者订阅的topic的路由信息这样就知道订阅的topic有哪些queue以及queue所在Broker的地址信息。

为什么消费者需要知道topic对应的哪些queue呢

其实主要是因为消费者在消费消息的时候是以队列为消费单元的消费者需要告诉Broker拉取的是哪个队列的消息至于如何拉到消息的后面再说。

消费的两种模式

前面说过消费者是有个消费者组的概念在启动消费者的时候会指定该消费者属于哪个消费者组。

DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("sanyouConsumer");
复制代码

一个消费者组中可以有多个消费者不同消费者组之间消费消息是互不干扰的。

在同一个消费者组中消息消费有两种模式。

集群模式
广播模式

集群模式

同一条消息只能被同一个消费组下的一个消费者消费也就是说同一条消息在同一个消费者组底下只会被消费一次这就叫集群消费。

集群消费的实现就是将队列按照一定的算法分配给消费者默认是按照平均分配的。

如图所示将每个队列分配只分配给同一个消费者组中的一个消费者这样消息就只会被一个消费者消费从而实现了集群消费的效果。

RocketMQ默认是集群消费的模式。

广播模式

广播模式就是同一条消息可以被同一个消费者组下的所有消费者消费。

其实实现也很简单就是将所有队列分配给每个消费者这样每个消费者都能读取topic底下所有的队列的数据就实现了广播模式。

如果你想使用广播模式只需要在代码中指定即可。

consumer.setMessageModel(MessageModel.BROADCASTING);
复制代码

ConsumeQueue

上一节我们提到消费者是从队列中拉取消息的但是这里不经就有一个疑问那就是消息明明都存在CommitLog文件中的那么是如何去队列中拉的呢难道是去遍历所有的文件找到对应队列的消息进行消费么

答案是否定的因为这种每次都遍历数据的效率会很低所以为了解决这种问题引入了ConsumeQueue的这个概念而消费实际是从ConsumeQueue中拉取数据的。

用户在创建topic的时候Broker会为topic创建队列并且每个队列其实会有一个编号queueId每个队列都会对应一个ConsumeQueue比如说一个topic在某个Broker上有4个队列那么就有4个ConsumeQueue。

前面说过消息在发送的时候会根据一定的算法选择一个队列之后再发送消息的时候会携带选择队列的queueId这样Broker就知道消息属于哪个队列的了。当消息被存到CommitLog之后其实还会往这条消息所在的队列的ConsumeQueue插一条数据。

ConsumeQueue也是由多个文件组成每个文件默认是存30万条数据。

插入ConsumeQueue中的每条数据由20个字节组成包含3部分信息消息在CommitLog的起始位置8个字节消息在CommitLog存储的长度8个字节还有就是tag的hashCode4个字节。

所以当消费者从Broker拉取消息的时候会告诉Broker拉取哪个队列queueId的消息、这个队列的哪个位置的消息queueOffset。

queueOffset就是指上图中ConsumeQueue一条数据的编号单调递增的。

Broker在接受到消息的时候找个指定队列的ConsumeQueue由于每条数据固定是20个字节所以可以轻易地计算出queueOffset对应的那条数据在哪个文件的哪个位置上然后读出20个字节从这20个字节中在解析出消息在CommitLog的起始位置和存储的长度之后再到CommitLog中去查找这样就找到了消息然后在进行一些处理操作返回给消费者。

到这我们就清楚的知道消费者是如何从队列中拉取消息的了其实就是先从这个队列对应的ConsumeQueue中找到消息所在CommmitLog中的位置然后再从CommmitLog中读取消息的。

RocketMQ如何实现消息的顺序性

这里插入一个比较常见的一个面试那么如何保证保证消息的顺序性。

其实要想保证消息的顺序只要保证以下三点即可

生产者将需要保证顺序的消息发送到同一个队列
消息队列在存储消息的时候按照顺序存储
消费者按照顺序消费消息

第一点如何保证生产者将消息发送到同一个队列

上文提到过RocketMQ生产者在发送消息的时候需要选择一个队列并且选择算法是可以自定义的这样我们只需要在根据业务需要自定义队列选择算法将顺序消息都指定到同一个队列在发送消息的时候指定该算法这样就实现了生产者发送消息的顺序性。

第二点RocketMQ在存消息的时候是按照顺序保存消息在ConsumeQueue中的位置的由于消费消息的时候是先从ConsumeQueue查找消息的位置这样也就保证了消息存储的顺序性。

第三点消费者按照顺序消费消息这个RocketMQ已经实现了只需要在消费消息的时候指定按照顺序消息消费即可如下面所示注册消息的监听器的时候使用MessageListenerOrderly这个接口的实现。

consumer.registerMessageListener(new MessageListenerOrderly() {
    @Override
    public ConsumeOrderlyStatus consumeMessage(List<MessageExt> msgs, ConsumeOrderlyContext context) {
        //按照顺序消费消息记录
        return null;
    }
});
复制代码