技术指标

1.Octo、Http服务可用性<99.9%

每周可用性低于99.9%且失败总数>=50

1)起因:查账单sql慢,发现是调es慢,es不能改造,需调大超时阈值,如很高,会有很多人看不到,做个权衡调整阈值。看99线(本周超时5.6次,0.00013不需调)

2)查看QPS、99线等指标

    进入Raptor,找服务appkey,点octoService看接口各项指标

    考察服务器性能,除QPS,还考察响应时间(负载增加,响应长)

    平均值:服务当前响应所有请求耗时平均值

    中位值:150ms,一半请求耗时小于150ms

    P95,P99:响应耗时从小到大排列顺序处于95%位置为P95。P95=180ms,95%请求耗时<180ms

    QPS:规定时间内所处理流量

2.TP99>2000ms(每周long-service日均值)

3.long-sql>1000ms 且 count > 500数量(周日均值)

4 ERROR数过多(>1000/天)

5 long-mq>300ms(日均值、趋势图,关注积压)

6 服务利用率

着重看一下核心服务,利用率大于45%则需要申请机器(机器配置:8C16G),86台3机房,目前24%

7 mysql集群利用率

1主3从  每个节点总空间5.7tb    利用率80%

8 ES集群利用率

共71个节点,3个主节点(1主2从),68个数据节点。每个数据节点800G存储空间。利用率20%


  

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 夜莺2517阅读 127,762评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,976评论 1 6
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,613评论 28 53
  • 兔子虽然是枚小硕 但学校的硕士四人寝不够 就被分到了博士楼里 两人一间 在学校的最西边 靠山 兔子的室友身体不好 ...
    待业的兔子阅读 2,663评论 2 9