第8章 打造平台稳定能力
1. 限流降低
2. 流量调度
3. 业务开关
4. 容量压测和评估
5. 全链路压测平台
6. 业务一致性平台
8.1 限流和降级
限流相当于保险丝, 当过载的时候掐掉一些流量, 让系统有能力集中资源以较快的速度处理能力范围内业务请求
sentinel
1. 授权: 通过配置白名单与黑名单的方式对HSF的接口和方法进行调用权限的控制
2. 限流: 对特定资源进行调用保护, 防止资源的过度调用
3. 降级: 判断依赖资源的响应情况, 当依赖资源响应时间过长自动降级, 并在指定时间后自动恢复
4. 监控: 提供全面的运行状态监控
8.2 流量调度
为什么单机局部问题会带来这么大的影响
1. 调用链路局部问题会被放大到整个链路
2. 单点局部问题会本放大成面
实现原理
通过秒级获取系统运行指标以及业务指标, 当发现满足规则条件时, 对线上服务器进行下线的操作
屏蔽单点或局部故障对整体平台产生扩展式的影响
8.3 业务开关
8.4 容量压测及评估规划
容量压测
生产环境上的流量模型引流到压测服务器上, 获取到服务器单机最大处理能力
优点
- 实用性
- 准确性
- 高效性
容量压测通过HSF权重配置, 压测单机容量, 获取单机QPS能力
容量规划平台
8.5 全链路压测平台
- 基础数据抽取
- 链路与模型构造
- 链路验证
- 业务改造
- 数据平台
- 流量平台
- 影子表
- 中间件改造
- 安全机制
8.6 业务一致性平台
在每个上线的业务都能形成一对一的监控与检测
- 高实时性地发现业务脏数据或错误逻辑实现
- 方便地接入各种业务规则
- 整合订正工具, 形成规范的脏数据订正流程
- 业务上线的实时监控,