IM - 消息四大特性与实现方案

1. 概述

本文介绍即时通讯软件中,消息的几个特性如何保证

  • 实时性
  • 安全性
  • 有序性
  • 可靠性(不重不漏)

2. 实时性

消息的传输过程,分为三个阶段:

  • 消息上行
  • 消息处理
  • 消息下行

其中,消息上下行,通过C/S全双工通信保证,并且有HeartBeat保证通道的可用性

消息处理由im-server实现,主要包含消息鉴权、消息审计、消息拆包,须保证稳定高效,可通过独立服务实现,保证其可扩展性

message-transfer.png

消息鉴权

单聊情况

  • 鉴权关系:sender与receiver是否好友(或同事)

群聊情况

  • 鉴权关系:sender是否是群组成员

消息审计

  • 审计内容:消息内容是否合法,不包含反党叛国、黄赌毒等语义
  • 审计设备:移动设备不能接收文件

消息拆包

对于群组消息,需要拆包,1个发送包生成N个接收包,N是当前群组成员数

如果当前群组超过500人,例如10000人,可以考虑采用消息广播机制,提高消息下行效率。

具体做法是,发送到MQ前,不拆分成10000个Package,而是X个Package,X等于SessionManager实例数。每个SessionManager实例收到Package后,自行拆包并发送到对应的TCP通道,Client即可实时接收到消息。

3. 安全性

  • 传输过程中,采用https和wss,或者gRPC证书,保证消息安全
  • 登录安全,采用JWT登录认证机制,防止身份信息被盗用

另外,发送时加密可进一步加强消息的安全性,但是不利于项目前期开发与调试,故优先级低

4. 有序性

4.1. 场景假设

场景1

在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

其中aa和cc发送成功,bb由于网络或设备问题,在client自动重试3分钟之后,最终发送失败,会展示一个是否重发的小button,用户可以自行决定是否重发。

如果用户点击按钮重发bb,user1和user2的消息列表会怎么展示?

user1aa、cc、bb,其中bb是从aacc中间删除,并append到最后

user2aa、cc、bb

场景2

在user1和user2的单聊会话中,user1发送3条消息,分别是aa、bb、cc。

其中aa发送成功,正在自动重发bb和cc时,user2发送了dd和ee,且user2发送成功。之后,bb和cc自动重发成功。

那么,user1和user2的消息列表会怎么展示?

user1aa、bb、cc、dd、ee,切换一次session,再回到当前session,看到的消息是aa、dd、ee、bb、cc

user2aa、dd、ee、bb、cc

场景3

在user1、user2和user3的群聊会话中,user1和user2在同一时刻发送消息到im-server,甚至im-server生成的timestamp也一样。

那么,user1、user2和user3的消息列表如何展示?

尚未模拟,期望由MQ来决定,先到达客户端,则排在前面

从上下文语义来讲,两条timestamp一样的消息,前后顺序不重要

小结

与场景1相比,场景2有两个不同点

  • 对于发送失败的消息,在自动发送成功后,原始顺序不变;如果是手动重发,则删除后追加到最后
  • 对于多条发送失败的消息,在自动发送成功后,receiver收到的顺序不应发生变化;如果是手动重发,则依赖手动触发重发的顺序

场景1和场景2的相同点

  • 最终的消息顺序,依赖服务端的timestamp,即消息顺序的最终一致性

4.2. 有序的定义

消息的有序性,更多是一种用户体验

  • 允许同一session中,不同成员看到的消息顺序不一致
  • 允许同一session中,某个成员的当前消息和历史消息顺序不一致
  • 不允许同一session中,所有成员的历史消息顺序不一致
  • 不允许单个user消息流乱序
  • 不允许当前session消息列表存在中间插入的情况,允许首尾追加中间删除的情况

4.3. 有序的实现

sequenceId

  • 生成规则:在client发送消息给server时,由sender生成,全局唯一,可以是{userId}-{sessionId}-{timestamp}-{autoIncrementNum}
  • 作用1:sender基于sequenceId,接收send-ack(包含server生成的messageId
  • 作用2:server基于sequenceId,完成消息去重(建议保存最近10条最长10分钟即可)
  • 作用3:receiver基于sequenceId,完成消息去重
  • 作用4:receiver基于sequenceId,解析得到userIdtimestampautoIncrementNum,校验单user消息流顺序(非session的消息流)。如果消息顺序不一致,则报错,但是,仍然追加到消息列表末尾

messageId

  • 生成规则:在server收到client的消息发送请求时,由server生成,全局唯一,统一标识某一消息,可以是{timestamp}-{uuid}-{messageType}
  • 作用1:client基于messageId,解析得到timestamp,完成session消息流排序
  • 作用2:client基于messageId,完成消息的增值功能,例如消息撤回消息编辑表情回复

单packge支持多message

  • 消息收发的数据包,需要支持多个message,例如一次发送多条message,或者一次接收多条message
  • 作用1:Client当前正在发送的消息数据包最多1个,对于待发送的消息,可以按顺序打包成一个消息数据包,一起发送
  • 作用2:在超大群组聊天时,服务端可以实现消息合并算法,即对receiver在x时间内的n条message进行打包发送

5. 可靠性(不重不漏)

如何实现消息的可靠性,保证消息不重不漏,需要从消息传输的三个环节着手

5.1. 消息上行

在c->s的过程中,采用send-ack的方式,如果client没有收到send-ack,则自动重发。

此过程,可保证消息不漏。但是,server收到的消息可能会重复。如果有重复sequenceId的消息,server须去重。

注意:server须在投递RabbitMQ成功、且RabbitMQ持久化之后,再返回send-ack。否则,消息可能丢失。

5.2. 消息处理

Server处理消息的流程可能有多个服务参与,例如SessionManager、Auditor。

为了保证消息的可靠性,每次与RabbitMQ的交互,需要保证成功投递安全消费

  • 成功投递,RabbitMQ完成持久化后才算成功投递
  • 安全消费,消息处理成功,且有下一个服务明确接棒,才算安全消费

5.3. 消息下行

在s->c的过程中,采用receive-ack的方式,如果server没有收到receive-ack,则自动重发。

此过程,可保证消息不漏。但是,receiver收到的消息可能会重复。如果有重复sequenceId的消息,receiver须去重。

如果receiver不在线,当receiver上线时,可通过API获取历史消息,并对历史消息列表进行二次校验(Server端须完成第一次校验),确保无重复sequenceId的消息。

注意:server须在receiver返回receive-ack后,再告知RabbitMQ消费成功。否则,消息可能丢失。

5.4. 参考

6. 总结

IM系统是不标准的,虽然XMPP协议试图解决这个问题,但事实证明根本不现实。

各家IM厂商几乎都是自已的私有协议,以及不同的实现逻辑,这也决定了即使同一个技术问题,对于IM来说很难有固定的实现套路和标准的解决方案。

不过,对于IM系统的几个硬性指标,是必须实现的。

实现过程中,需要考虑性价比,是追求更高的系统并发,还是更可靠的数据流;是追求更大的系统吞吐,还是更好的可扩展性和容灾。

最后,推荐一个IM专栏:
https://segmentfault.com/u/jackjiang

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容

  • 组成http网关:认证、负载均衡网络接入层:维持长连接,接收、推送消息业务服务层:聊天业务相关的消息处理服务red...
    墙角儿的花阅读 1,750评论 0 0
  • 安全 随着应用程序开发的进行,您将需要使用Parse的安全功能来保护数据。本文档介绍了如何保护应用程序。 如果您的...
    xiangdong_9013阅读 927评论 2 1
  • 最近突然对安卓消息推送的原理感兴趣,找了不少资料,实现了一个包括服务端和客户端的简单Demo。 在具体实现的时候踩...
    嘉伟咯阅读 24,039评论 1 12
  • 文章部分内容转载自:http://blog.csdn.net/zhangerqing 一、设计模式的分类 总体来说...
    j_cong阅读 2,061评论 0 20
  • 6 跟踪用户动作 在上一章中,你用jQuery实现了AJAX视图,并构建了一个分享其它网站内容的JavaScrip...
    lakerszhy阅读 1,221评论 0 1