第7章 打造数字化运营能力
1. 如何对几千亿此调用中报错快速定位
2. 如何实时监控服务状态是否正常
3. 如何给运营团队关注的业务指标提供实时呈现供他们进行实时的精准营销
7.1 业务服务化带来的问题
快速定位问题
a408a4a560184f2487da9d75b70eb7bc_image.png
937cb7b537bf4c7e810f6e65a247e3a1_image.png
开发人员关注
1. 我的服务在什么链路下被调用, 调用场景和数据是否合理
2. 目前服务调用趋势怎样, 产生的瞬间峰值有多少, 是否达到服务能力的最高水位线
业务架构师关注
1. 当前业务流程设计中, 我依赖了哪些应用, 哪些服务 (依赖)
2. 整个链路的依赖路劲是怎样的, 哪些服务对当前业务是最核心的, 如果出错, 有什么影响 (核心依赖)
3. 一次业务请求处理的时间到底花费在什么地方 某个服务耗时很长 还是某个数据库访问耗时最久 (瓶颈)
4. 过去一段时间哪些服务出错率比较高, 哪些服务是处理瓶颈 (问题瓶颈)
我们把整个淘宝分布式服务架构比喻为全国高速公路网
5b16d17bf8fa42758c70f348bc54e86f_image.png
车辆行驶路线和过路费信息
e9db35d3b14b49d69bbb052018cb6ffc_image.png
7.2 鹰眼平台的架构
f72a1338cb464e6b8a4831a2f1bd75f2_image.png
7.3 埋点和输出日志
662e890ff2284de09999b6a86da41daf_image.png
86d571b53f19496082bbc3748352e82e_image.png
7.4 海量日志分布式处理平台
7.5 日志收集控制
7.6 典型业务场景
7.6.1 服务实时监控
7.6.2 服务调用链跟踪
7.6.3 服务调用链分析
7.6.4 业务全息排查
7.6.5 业务实时监控
2000052af1f7426ebb88b591ccb89165_image.png