第8章 打造平台稳定能力

第8章 打造平台稳定能力

1. 限流降低
2. 流量调度
3. 业务开关
4. 容量压测和评估
5. 全链路压测平台
6. 业务一致性平台

8.1 限流和降级

限流相当于保险丝,  当过载的时候掐掉一些流量, 让系统有能力集中资源以较快的速度处理能力范围内业务请求
d4d0b23fd90141719e75af4a48e26722_image.png
sentinel
1. 授权: 通过配置白名单与黑名单的方式对HSF的接口和方法进行调用权限的控制
2. 限流: 对特定资源进行调用保护, 防止资源的过度调用
3. 降级: 判断依赖资源的响应情况,  当依赖资源响应时间过长自动降级, 并在指定时间后自动恢复
4. 监控: 提供全面的运行状态监控
69697738fd5045919cfc71253612116c_image.png

8.2 流量调度

为什么单机局部问题会带来这么大的影响
1. 调用链路局部问题会被放大到整个链路
2. 单点局部问题会本放大成面
实现原理
通过秒级获取系统运行指标以及业务指标,  当发现满足规则条件时, 对线上服务器进行下线的操作
屏蔽单点或局部故障对整体平台产生扩展式的影响
bbe27464f5234df79eb89f8aac0d8259_image.png

8.3 业务开关

607e75559a774b6281e108b66cc40f03_image.png

8.4 容量压测及评估规划

容量压测

生产环境上的流量模型引流到压测服务器上, 获取到服务器单机最大处理能力

优点
  • 实用性
  • 准确性
  • 高效性

容量压测通过HSF权重配置, 压测单机容量, 获取单机QPS能力

容量规划平台

8.5 全链路压测平台

  • 基础数据抽取
  • 链路与模型构造
  • 链路验证
  • 业务改造
  • 数据平台
  • 流量平台
  • 影子表
  • 中间件改造
  • 安全机制

8.6 业务一致性平台

在每个上线的业务都能形成一对一的监控与检测

  • 高实时性地发现业务脏数据或错误逻辑实现
  • 方便地接入各种业务规则
  • 整合订正工具, 形成规范的脏数据订正流程
  • 业务上线的实时监控,
d5f3f388076d4af1b29e717950e00d89_image.png
f680626e6564433683758fac98413dd9_image.png
912cf1d8bc404471b7f36756dd139029_image.png
fbafb129c88644ae90e544fac994b548_image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。