IM (一):基本介绍

By 紫韵: 最近对 IM 系统产生了兴趣,就看了些博客,现希望通过一个系列的文章对其稍作总结与记录,如有不对,还望指正。

IM 简介

IM:Instant Messaging,即时通讯,是一个允许两人或多人通过网络实时传输文字、语音、视频等的终端服务,如现在常用的 QQ、微信、百度 Hi 等。IM 完全基于 TCP/IP 网络协议族实现,而 TCP/IP 协议族则是整个互联网得以实现的技术基础。

通讯方式

典型的 IM 通讯方式有如下四种:

  • 在线直连通讯:即 P2P(Peer To Peer)对等通讯方式,也就是通信双方直接建立通信连接进行点对点的通信;
  • 在线中转通讯: 通信双方不是通过点对点直连方式进行通信,而是通过一个服务端作为代理来进行通信,即消息发送方将消息发送给服务器,然后服务器再将消息转发给消息接收方;
  • 离线中转通讯:以上两种方式都是基于通信双方均在线的前提之下,但是有时消息接收方并不一定刚好在线。当消息接收方处于离线状态时,也需要采用服务端中转方式进行消息投递。消息发送方现将消息发送到服务端,然后服务端转储消息,待消息接收方上线时再将消息转发给接收方;
  • 扩展通讯:扩展通讯即调用其他通讯方式来完成通讯过程,如通过短信、Email、传真等方式将消息从发送方投递到接收方。

P2P && 服务器中转
一般常用的 IM 通讯方式就是 P2P 和服务器中转这两种,下面简要对比分析这两者的区别。

P2P:
P2P 多见于局域网内聊天工具,典型的应用有:飞鸽传书、天网 Maze 等。这类软件在启动后一般做两件事情:
进行 UDP 广播:发送自己信息和接受同局域网内其他端信息;
开启 TCP 监听:等待其他端进行连接。

限制和不便:
只适合 ** 在线 ** 的 ** 点对点 ** 消息传输,对离线、群组等业务支持不够;
由于 NAT 的存在,使得不同局域网内机器互联难度大大上升,在某些网络类型(对称 NAT)下无法建立连接。

** 服务器中转 **
几乎所有互联网 IM 产品都采用服务器中转这种方式进行消息传输,相比于 P2P 的方式,它的优劣如下:

  • 优点:
    能够支持更多P2P无法支持或支持不好的业务,如离线消息,群组,聊天室服务;
    方便业务逻辑的拓展和新旧版本的兼容。

  • 缺点:服务器架构复杂,并发要求高。

工作方式

** 典型的 IM 工作方式如下:**
客户端登陆 IM 通讯中心(IM 通讯服务器),获取好友列表,获取离线消息,将自身标志为在线状态,与聊天对象建立聊天通道,进行文字、语音等通信。

  1. 用户 A 通过用户名和密码登录 IM 服务器,服务器通过读取数据库中用户信息进行校验,校验通过后,登记用户 A 的 ip 地址、IM 客户端版本号、使用的 TCP/UDP 端口号等并标记用户 A 的状态为在线,返回用户 A 登录成功标志;
  2. 用户 A 获取好有列表信息(包括:在线状态、IP 地址、TCP/UDP 端口号等)、离线消息;
  3. 服务器将用户 A 的在线相关信息通知到其在线好友 ,包括:在线状态、IP 地址、TCP/UDP 端口号等;
  4. 接下来用户 A 就可以通过直连/服务器中转方式与其它用户进行消息通信了。

IM 系统选型

一个典型的 IM 系统的选型过程大致包含如下几个部分:

  • 服务方式:P2P or 服务器中转;
  • 网络通讯协议:TCP or UDP;
  • 数据通信协议:XMPP、SIP、MQTT、Protobuf、私有协议;
  • 协议加密:加密流程的设计、加密算法的选择;
  • 服务器:开源的 IM 服务器,如 OpenFire,Tigase,Prosody,Mosquitto,ejabberd等、自己的服务器。

** IM 系统架构分层:**

  • ** 接入层(ENTRY):** 作为客户端和服务端的接口子系统,此层直接面对 PC 桌面客户端、WEB 网页客户端、移动 APPS 客户端的海量长连接请求,负责建立与客户端通信的加密通道,整合成内部少量有限的长连接,对通信数据进行压缩与解压,并将相应请求转发至逻辑层。除此之外,接入层实施初步的攻防策略,用来抵御非逻辑层面的攻击,监控某些数据(连接频率、发包频率、发包速率等),对 IP/UID 等指标实施封禁,IM 在某些紧急情况下,必须能够迅速实施封禁,所以需要实时授权 IP/UID 等黑白名单,使得白名单动态生效、黑名单自动解封。
  • ** 逻辑层(LOGIC):** 逻辑子系统主要是负责整个 IM 系统的逻辑处理,包括用户相关(用户登录登出、用户信息设置查询)、好友相关(添加好友、获取好友、删除好友、修改好友信息等)、消息相关(收发好友消息、收发陌生人消息、消息确认、通用消息处理、离线消息等)等复杂逻辑处理。
  • ** 路由层(ROUTER):** 路由子系统主要处理和用户一次登录 session 相关的数据(比如:用户在线状态[在线、离开、隐身],登录IP等),这部分涉及的数据变化非常快,没必要固化,直接存储在内存中。并记录用户登录接入层的路由信息,支持向指定 UIDS 通信的功能。
  • ** 数据层(DATA ACCESS):** 统一数据访问子系统屏蔽了底层的存储引擎,上层无需关心实际的存储是 RDBMS 或者 NoSQL 或者其他的 KV 存储引擎,对上层提供友好、统一的访问接口,封装原子逻辑。并通过 CURD 接口的抽象封装,增加新的数据操作只需要增加配置,不用变动数据层代码,较容易完成关键数据的存储。
  • ** 数据存储层(DATA STORAGE):** 数据存储层是 IM 的固化存储系统,根据业务数据特点决定使用何种持久化存储方式(RDBMS(MySQL)、NoSQL(MongoDB)等),并通过分布式缓存(Memcached、Redis等)加速查询。

一个典型的 IM 系统可能由如下及部分组成:

  • 客户端:用于让用户接入系统;
  • 注册服务器:用户接入系统时使用,提供鉴权等相应处理;
  • 连接服务器:用于保持与所有用户的连接,状态消息的通知以及客户会话请求时通信服务器相关信息的返回;
  • 通信服务器:用于通信渠道的建立以及离线信息的保存。包括离线文件传输。根据实际情况可以考虑增加一台文件服务器,供通信服务器使用;
  • 数据库服务器:提供对于数据库所有的操作接口。所有关于数据库的操作均归必须通过该台位;
  • 鉴权服务器:可有可无,供注册服务器使用,主要用于鉴权。

IM 系统功能点/技术点分析

*** 功能点分析:***

  • 注册登录:注册方式(手机、邮箱、昵称)、登录验证(注册信息、三方、手机动态验证登录)等;
  • 聊天:文字、语音、图片、视频、表情;单聊、群聊;
  • 传输服务:文本传输、文件传输;
  • 好友 / 群组管理:添加、删除、查找好友 / 群;
  • 多端服务:PC 端、Android 端、IOS 端等;
  • 用户信息管理。

*** 技术点分析:***

  • 登录优化:

    • 登录方式:注册信息、三方、手机验证码动态登录、无需登录等;
    • LBS 请求:异步化,不在登录时进行 LBS 请求,而是在网络空闲和发生变化时进行请求并缓存,每次登录则直接从本地缓存获取连接地址,以加快登录速度;
    • DNS 优化:移动端 DNS 解析时间长、准确率较低、容易被劫持,特别需要优化;优化策略:
      • 使用 HTTP DNS,如开源的 HttpDNSLib;
      • 尽可能避免 DNS 解析请求:如 LBS 直接返回待连接的服务器的 IP 地址而非域名;本地缓存 LBS IP 地址备用,请求 LBS 时优先使用 IP 而非域名;
    • 登录认证请求的优化;
    • 数据同步策略优化:用户登录 IM 系统后,需要在主界面呈现用户的好友列表、群组列表等信息,主要包括:好友列表、好友详情信息、群组列表、群组详情信息、群成员列表、群成员详情信息等。如果所有信息均在登录过程中进行同步的话,登录过程会耗时很长,并且流量消耗很大,从而导致用户体验很差,大致可以从如下几个方面进行优化:
      • 按时间戳同步:客户端只同步比本地缓存新的数据;
      • 延迟加载和按需更新:初始页面并不需要将所有信息均提供给用户,而是只需要保证映入用户眼帘的页面信息完全即可,这些信息主要有:好友列表、群组列表、离线消息记录;而好友详情信息、群组详情信息、群成员列表和群成员详情信息等均可以在用户进入相应的页面再按需更新或等到网络空闲时再加载即可;
  • 服务器负载优化:多服务器专职化,各司其职(专门用于登录、鉴权、状态管理的服务器;专门用于消息通信的服务器等);服务器集群;分流(如可考虑消息直连通信 P2P);

  • 消息同步机制

  • 消息可靠性保证

  • 消息时序性和一致性

  • 消息推送机制

  • 心跳保活机制

移动端 IM 技术难点

** 移动端 IM 客户端难点 **

  1. ** 流量:**移动端流量费较贵,所以省流量是移动端产品特别需要注意的性能指标。可以从网络通信协议、数据通讯协议、图片压缩技术、附件压缩技术等方面着手减少流量消耗;
  2. ** 耗电量 :**移动端的电量比较少,充电比较麻烦,需要注意电量消耗。一般来说,流量越小,耗电量越少;心跳次数越少,耗电量越少,不过这需要结合具体的业务场景来制定恰当的心跳策略;
  3. ** 心跳时长:**WIFI、2G、3G、4G、移动、电信、联通等不同网络、不同运行商下 NAT 失效时间是不一样的,因此心跳的时间也应当区别对待;
  4. ** 掉线重连机制** ;
  5. ** 网络不稳定:**移动端最大的特点就是网络切换频繁,从而导致网络不稳定,并且不同的网络环境下需要进行不同的处理(如 WIFI 网络和移动网络需要区别对待)。在不稳定的网络状态下,如何保证消息的到达率?如何保证消息以最快的速度到达?如何避免重联风暴?这些既需要从整体架构考虑,也需要在移动端采取巧妙的策略加以避免;
  6. ** 文件上传优化 **。

** 移动端架构设计的难点 **

  1. ** 连接器的设计:**连接器主要用来管理客户端的长连接;
  2. ** 中间件的设计:**是否采用通讯中间件?各种通讯中间件的优劣分析与选择?如果不采用中间件,如何管理连接器和逻辑服务器的连接关系?
  3. ** 逻辑服务器:**逻辑服务器通常简单一点,主要是根据业务逻辑进行最小粒度的划分即可;
  4. ** 状态服务器:**状态服务器主要管理用户在线、离线的相关状态。状态同步机制如何实现?状态存储机制,如何进行读写操作从而最大限度地提高状态服务器的处理能力和响应速度;
  5. ** 数据库的设计:**数据库设计相对来说比较难,当业务增长时容易成为性能瓶颈。因为无论是 SQL 关系型数据库,还是 NOSQL 非关系型数据库均有读写处理上限。
  6. ** 其他:**如推送机制、消息的可靠投递、消息同步机制、消息的时序性和一致性如何保证、在线消息和离线消息的区别对待等。这些都是必备而又非常复杂的功能技术点,都需要采取正确的架构和策略才能实现。

参考文章

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,988评论 25 707
  • 点击查看原文 Web SDK 开发手册 SDK 概述 网易云信 SDK 为 Web 应用提供一个完善的 IM 系统...
    layjoy阅读 13,744评论 0 15
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,647评论 18 139
  • 都说三十而立,我这都三十好几的人了,怎么就越来越迷茫呢?我是谁?我想要什么?我深在迷雾当中,看不清,摸不到...
    Lily乜力阅读 376评论 0 0
  • 全息网游之青楼
    孤鴻焚盡天意阅读 155评论 0 1