SET化架构与RabbitMQ基础组件封装

互联网单元化架构设计衍变之路

随着大型互联网公司业务的多元化发展,就拿滴滴、美团等大厂来讲,如滴滴打车、单车、外卖、酒店、旅行、金融等业务持续高速增长,单个大型分布式体系的集群,通过加机器+集群内部拆分(kv、mq、Mysql等),虽然具备了一定的可扩展性。但是,随着业务量的进一步增长,这个集群规模琢渐变的巨大,从而一定会在某个点达到性能瓶颈,无法满足扩展性需要,并且大集群内核服务出现问题,会影响全网所有用户。

以滴滴打车、美团外卖举例来说:

  • 打车业务体量巨大,尤其在早晚高峰期。全年订单量已越10亿。
  • 外卖业务体量庞大,目前单量突破1700w/天,对应如此庞大的单个大型分布式集群,会面临一下问题:

1、容灾问题
2、资源扩展性问题
3、大集群拆分问题

容灾问题

  • 核心服务(比如订单服务)挂掉,会影影响全网所有的用户,导致整个业务不可用;
  • 数据库主库集中在一个IDC,主机房挂掉,会影响全网所有用户,整个业务无法快速切换和恢复

资源扩展问题

  • 单IDC的资源(机器、网络带宽等)已经没法满足,扩展IDC时,存在跨机房访问延时问题(增加异地机房,时延问题严重)
  • 数据库主库单点,连接数有限,不能支持应用程序的持续发展;

大集群拆分问题

  • 核心问题:分布式集群规模扩大后,会响应的带来资源扩展、大集群拆分以及容灾问题
  • 所有处于对业务扩展性以及容灾需求的考虑,我们需要一套从底层架构彻底解决问题的方案,业界主流解决方案:单元化架构方案

SET单元化架构方案

同城 "双活" 架构介绍
目前很多大型互联网公司的业务架构可以理解为同城"双活"架构,注意这里的“双活"是加引号的,具体可以这样理解:

  • 1、业务层面上已经做到的真正的双活(或者多活),分别承担部分流量;
  • 2、存储层面比如定时任务、缓存、持久层、数据分析等都是主从架构,会有跨机房写的问题;
  • 3、一个数据中心故障,可以手动切换流量,部分组件可以自动切换;

两地三中心架构介绍
使用灾备的思想,在同城“双活”的基础上,在异地部署一套灾备数据中心,每个中心都具有完备的数据处理能力,只有当主节点故障需要容灾时才会紧急启动备用数据中心;

image.png

SET化方案目标:
业务:解决业务遇到的扩展性和容灾等需求,支撑业务的高速方案
通用性:架构侧形成统一通用的解决方案,方面各业务线接入使用

SET化架构设计:

SET化架构设计

SET化架构策略

流量路由:

  • 按照特殊的key(通常为userid)进行路由,判断某次请求该路由到中心集群还是单元化集群;

中心集群:

  • 为进行单元化改造的服务(通常不在核心交易链路,比如供应链系统)称为中心集群,跟当前架构保持一致。

单元化集群:

  • 每个单元化集群只负责本单元内的流量处理,以实现流量拆分以及故障隔离;
  • 每个单元化集群前期只存储本单元产生的交易数据,后续会做双向数据同步,实现容灾切换需求;

中间件(RPC、KV、MQ等):

  • RPC:对于SET服务,调用封闭在SET内;对于非SET服务,沿用现有的路由逻辑;
  • KV:支持SET的数据生产和查询;
  • MQ:支持分SET的消息生产和消费;

数据同步:

  • 全局数据(数据量小且变化不大,比如商家的菜品数据)部署在中心集群,其他单元化集群同步全局数据到本单元化内;
  • 未来演变为异地多活架构时,各单元化集群数据需要进行双向同步来实现容灾需要

异地容灾:

  • 通过SET化架构的流量调度能力,将SET分别部署在不同地区的数据中心,实现跨地区容灾支持

高效的本地化服务:

  • 利用前端位置信息采集和域名解析策略,将流量路由到最近的SET,提供最高效的本地化服务;
  • 比如O2O场景天然具有本地生产,本地消费的特点,更加需要SET化支持

集装箱扩展:

  • SET的封装性支持更灵活的部署扩展性,比如SET一键创建/下线,SET一键发布等。
SET化架构图

C不是很重要,所以放到中心集群,需要的时候去中心集群调用,及时调用超时或失败,也不影响主流程

SET化架构流转图

SET化架构落地原则

对业务透明原则:

  • SET化架构的实现对业务代码透明,业务代码层面不需要关系SET化规则,SET的部署等问题

SET化切分的规则:

  • 理论上,切分规则有业务层面按需定制;
  • 实际上,建议优先选最大的业务维度进行切分;
  • 比如海量用户的O2O业务,按用户位置信息进行切分。此外接入层、逻辑层和数据层可以由独立的SET切分规则,有利于实现部署和运维成本的最优化

部署规范原则:

  • 一个SET并不一定只限制在一个机房,也可以跨机房或者跨地区部署;为保证灵活性,单个SET内机器数不宜过多(如不超过1000台物理机)。

RabbitMQ-SET化架构实现

  • SET化消息中间件架构实现(RabbitMQ双活):


    image.png

使用RabbitMQ异步消息通信插件 Federation(节点和节点、集群和集群之间通信) 安装与配置:

  • 安装插件
rabbitmq-plugins enable rabbitmq_federation
rabbitmq-plugins enable rabbitmq_federation_management

  • 备注:当你再一个cluster中使用了federation插件,所有在集群中的 nodes都需要安装federation插件

  • 使用RabbitMQ通信插件Rederation:

  • Federation插件是一个在不需要cluster进行数据同步的(选择一个cluster中的节点和另一个cluster节点同步),而brokers之间传输消息的高新性能插件。

  • Federation插件可以在brokers或者cluster之间传输消息,链接的双方可以使用不同的users和virtual hosts、或者双方的rabbitmq和erlang版本不一致,federation插件使用AMQP协议通信,可以接受不连续的传输。

SET化配置规则:

  • 第一,Federation Exchanges,可以看成Downstream(82节点)从Upstream(81节点)主动拉取消息,并不是拉取所有消息,必须是在Downstream上已经明确定义Bindings关系的Exchange,也就是有实际的物理Queue来接收消息,才会从Upstream拉取消息到Downstream。使用AMQP协议实施代理间通信,Downstream会将绑定关系组合在一起,绑定/解绑命令将发送到Upstream交换机。

  • 第二,经过配置后,Upstream节点已经可以把消息直接通过Federation Exchanges路由给我们的Downstream节点,然后进行消费。

也就是说可以实现消息的转发,接下来也可以在Upstream添加具体的队列去进行消费Federation Exchanges里的消息,我们一条消息分别发送到2个RabbitMQ集群并且消费,这样我们可以实现SET化的关键要素,就是集群间的消息同步了。

  • 第三,可以根据自己的业务规则去规划不同的集群去监听不同的消息队列,从而达到SET化的手段,保障了性能、可靠性、数据一致性。

RabbitMQ-基础组件封装

MQ组件实现思路和架构设计方案

image.png

MQ组件需要实现功能点

  • 支持消息高性能序列化转换、异步化发送消息
  • 支持消息生产实例与消费实例的链接池化、缓存化,提升性能
  • 支持可靠性投递消息,保障消息的100%不丢失
  • 支持消费端的幂等操作,避免消费端重复消费的问题
  • 支持迅速消息发送模式,在一些日志收集、统计分析等需求下可以保证高性能,超高吞吐量(可忽略100%投递)
  • 支持延迟消息模式,消息可以延迟发送,指定延迟时间,用于某些延迟检查、服务限流场景
  • 支持事务消息,且100%保障可靠性投递,在金融行业单笔大金额操作是会有此类需求
  • 支持顺序消息,保证消费送达消费端的前后顺序,例如下订单,再送积分、优惠券等复合性操作
  • 支持消息补偿,重试,以及快速定位异常/失败消息
  • 支持集群消息负载均衡,保障消息落到具体SET集群的负责均衡
  • 支持消息路由策略,指定某些消息路由到指定的SET集群

迅速消息发送

  • 迅速消息是指消息不进行落库存储,不做可靠性的保障
  • 在一些非核心消息、日志数据、或者统计分析等场景下比较合适
  • 迅速消息的特点就是性能最高,吞吐量最大


    image

确认消息发送

image.png
  • 1、step1,step2:业务信息和消息信息入库
  • 2、step3:消息发送到MQ Broker
  • 3、step4:Broker回送一个ACK确认消息
  • 4、step5:更新DB中消息状态
  • 5、step6:定时任务读取中间状态消息
  • 6、step7:执行消息重发
  • 7、step8:重发多次依旧失败的消息, 将其置为失败终态

批量消息发送

  • 批量消息是指我们把消息放到一个集合里统一进行提交,这种方案设计思路是期望消息在一个会话里,比如投掷到threadlocal里的集合,然后拥有相同会话ID,并且带有这次提交消息的size等相关属性,最重要的一点是要把这一批消息进行合并。对应Channel而言,就是发送一次消息。这种方式希望消费端在消费的时候,可以进行批量化的消费,针对于某一个原子业务的操作去处理,但是不保障可靠性,需要进行补偿机制


    image.png

延迟消息发送

  • 延迟消息相对简单,就是我们在Message封装的时候添加delayTime属性即可,使得我们的消息可以进行延迟发送,根据具体的业务场景也可以很好的使用得到。
  • 场景举例:

比如你在电商平台买到商品签收后,不点击确定支付,那么系统自动会在7天(一定时间)去进行支付操作。
还要一些自动超时作废场景,你的优惠券/红包有使用时间限制,也可以用延迟消息机制。

顺序消息发送

  • 顺序消息,比较类似于批量消息的实现机制,但是有些不同。
  • 我们要保障以下几点:

1、发送的顺序消息,必须保障消息投递到同一个队列,且这个消费者只能有一个(独占模式)
2、然后需要统一提交(可能合并成一个大消息,也可能拆分成多个消息),并且所有消息的会话ID一致。
3、添加消息属性:顺序标记的序号、和本次顺序消息的SIZE属性,进行落库操作。
4、并行进行发送给自身的延迟消息(注意带上关键属性:会话ID、SIZE)进行后续处理消费(接收到第一个消息后,创建延迟消息队列,等几分钟后,所有的顺序消息都落库后)
5、当收到延迟消息后,根据会话ID、SIZE抽取数据库数据进行处理即可。
6、定时轮询补偿机制,对于异常情况
备注:比如生产端消息没有完全投递成功,或者消费端落库异常导致消费端落库缺少消息条目的情况

image.png

事务消息发送

  • 事务消息,相对使用比较少见,但是在互联网行业中,面对单笔大额现金流交易时遇到遇到过:比如单笔转账超过一个上限的时候,我们就希望这个消息优先级最高,并且可靠性要求达到100%,当然我们的系统和银行端系统都要兼顾才行,所有也会有一些补偿机制,主动发起银行端查询指令机制等。
  • 为了保障性能的同时,也支持事务。我们并没有选择传统的RabbitMQ事务和Spring集成的机制,因为在性能测试过程中,效果并不理想,非常消耗系统资源且会出现阻塞等情况,在高峰期也是一定程度上影响MQ集群的性能
  • 解决方案:

我们采用类似可靠性投递的机制,也就是补偿机制。
但是我们的数据源必须是同一个,也就是业务操作DB1数据和消息记录BD2数据库必须使用同一个数据源
然后利用重写Spring DatasourceTransactionManage,在本地事务提交的时候进行发送消息,但是也有可能事务提交成功但是消息发送失败,这个时候就需要进行补偿了。

  • DatasourceTransactionManager核心代码:


    image.png

消息幂等性保障-消息路由规则架构设计

消息幂等性的重要性

  • 保障消息的幂等性,这也是我们在使用MQ中至关重要的环节
  • 可能导致消息出现非幂等性的原因:

1、可靠性消息投递机制(消息失败时多次发送)
2、MQ Broker服务与消费端传输消息过程中出现网络抖动
3、消费端的故障或异常
以上这些问题都会导致消费端重复消息问题。


image.png

参考:
https://www.jianshu.com/p/4dc45fc5936c

https://blog.csdn.net/love905661433/article/details/85452115

https://www.jianshu.com/p/a1bb3e1eba87

http://www.talkwithtrend.com/Article/245299

http://blog.itpub.net/26736162/viewspace-2216584/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351