自定义处理 hystrix 历史监控数据

在 spring cloud 中引入 hystrix 使我们得以在内部依赖的某个服务异常时能够快速失败和做降级处理,而不至于级联影响到本身对其他接口的服务。

但是 hystrix 的配置还是蛮的,比如线程池隔离方法的核心线程数、等待队列数,或是各服务的超时时间等,虽然 hystrix 提供了一些默认的配置如官方 wiki https://github.com/Netflix/Hystrix/wiki/Configuration 列举。

hystrix 本身提供了 /hystrix.stream 这个 url 来持续输出监控数据,我们也可以用 dashboard 来图形化这些数据,如


hystrix dashboard

此图表可以查看实时的监控数据,qps、是否短路、成功调用、失败调用、线程池状态等。虽然很实时,但是我们一开始预设的 hystrix 参数总是先连蒙带猜的,而应用的压力根据业务的不同高峰时段也是各种各样的,我们总不能无时无刻盯着这个图表来看某个参数是否过剩或者是否紧张。

得有个法子将这些监控数据给落地起来

一、插件方式

翻阅 hystrix 文档,其中插件部分有个 MetricsPublisher

image.png

我们可以通过继承 HystrixMetricsPublisher,重写 getMetricsPublisherForCommand 、 getMetricsPublisherForThreadPool、 getMetricsPublisherForCollapser 三个方法; 通过方法名我们可以看出它们返回的对象分别负责针对 Hystrix 命令(调用)、线程池、请求合并三种监控数据的发布;Command、ThreadPool、Collapser 就是监控状态的核心对象了,hystrix 会定时去更新这些对象的状态。

这几个方法只会在插件注册的时候调用一次, 并将hystrix 命令、 线程池和请求合并这些相关的监控对象的引用传入


HystrixMetricsPublisher

这几个返回类型结构类似,我们以 HystrixMetricsPublisherThreadPool 为例
在构造实例的时候传入了线程池名称,线程池监控对象、线程池属性对象, 我在 initialize 初始化的时候开启一个线程去定时读取这几个监控对象的状态 然后执行自定义的处理逻辑(如推入 mq 或直接存入db中,然后过一段时间对这些数据进行统计分析),代码如下

  static class HystrixMetricsStoredPublisherThreadPool  implements HystrixMetricsPublisherThreadPool {

        private final HystrixThreadPoolKey threadPoolKey;
        private final HystrixThreadPoolMetrics metrics;
        private final HystrixThreadPoolProperties properties;

        public HystrixMetricsStoredPublisherThreadPool(
                HystrixThreadPoolKey threadPoolKey,
                HystrixThreadPoolMetrics metrics,
                HystrixThreadPoolProperties properties) {
            // 需要把  getMetricsPublisherFor**ThreadPool** 传入的几个参数的引用保存起来 
            this.threadPoolKey = threadPoolKey;
            this.metrics = metrics;
            this.properties = properties;
         }

        /**
        *  只会在注册的时候执行一次,所以需要我们自己开启线程定时监控 构造函数传入的这几个对象的状态
        */
        @Override
        public void initialize() {
            System.out.println("HystrixMetricsStoredPublisherThreadPool ----------- ");
            ExecutorService executorService = Executors.newFixedThreadPool(1);
            executorService.execute(
                    () -> {
                        StringBuilder sb = new StringBuilder("hystrix-metrics ------------------ ");
                        sb.append("\r\n");
                        sb.append("CurrentQueueSize: " + metrics.getCurrentQueueSize());
                        sb.append("CurrentCorePoolSize: "+metrics.getCurrentCorePoolSize());
                        sb.append("CumulativeCountThreadsRejected: " + metrics.getCumulativeCountThreadsRejected());
                        sb.append("CurrentActiveCount: " + metrics.getCurrentActiveCount());

                        // 在开启的线程中,定时读取 threadPoolKey、metrics、properties 三个字段的属性值
                        // 写入 mq 或者 db 供后续数据统计分析
                    });
        }
    }

然后在应用启动类中注册即可

static {
         HystrixPlugins.getInstance().registerMetricsPublisher(new HystrixMetricsStoredPublisher());
    }

二、 自定义监控 (推荐)

接入 hystrix 后,我们实时查看监控数据的方式是在 dashboard 中填入 {server-url}/hystrix.stream
这个链接会不断输出如下格式的数据

data: {"type":"HystrixThreadPool","name":"XXClient","currentTime":1526545816036,"currentActiveCount":0,"currentCompletedTaskCount":1,"currentCorePoolSize":20,"currentLargestPoolSize":1,"currentMaximumPoolSize":20,"currentPoolSize":1,"currentQueueSize":0,"currentTaskCount":1,"rollingCountThreadsExecuted":0,"rollingMaxActiveThreads":0,"rollingCountCommandRejections":0,"propertyValue_queueSizeRejectionThreshold":5,"propertyValue_metricsRollingStatisticalWindowInMilliseconds":10000,"reportingHosts":1}

那既然这个 url 输出的就是我想要的数据,并且这个格式可以供 dashboard 解析,那么我直接把这种格式的数据落地起来(mq 异步落地 还是直接同步db )的话,是不是就可以读取这些数据来在 dashboard 上重播?

我找到这个url 对应的 servlet 类 HystrixMetricsStreamServlet extends HystrixSampleSseServlet 核心代码如下

// HystrixSampleSseServlet 中 doGet 里调用
private void handleRequest(HttpServletRequest request, final HttpServletResponse response) throws ServletException, IOException {
    final AtomicBoolean moreDataWillBeSent = new AtomicBoolean(true);
    Subscription sampleSubscription = null;

    /* ensure we aren't allowing more connections than we want */
    int numberConnections = incrementAndGetCurrentConcurrentConnections();
    try {
        int maxNumberConnectionsAllowed = getMaxNumberConcurrentConnectionsAllowed(); //may change at runtime, so look this up for each request
        if (numberConnections > maxNumberConnectionsAllowed) {
            response.sendError(503, "MaxConcurrentConnections reached: " + maxNumberConnectionsAllowed);
        } else {
            /* 初始化响应,设置一些 http 响应头 */
            response.setHeader("Content-Type", "text/event-stream;charset=UTF-8");
            response.setHeader("Cache-Control", "no-cache, no-store, max-age=0, must-revalidate");
            response.setHeader("Pragma", "no-cache");

            final PrintWriter writer = response.getWriter();

            //since the sample stream is based on Observable.interval, events will get published on an RxComputation thread
            //since writing to the servlet response is blocking, use the Rx IO thread for the write that occurs in the onNext
            // rxjava 的方式订阅
            sampleSubscription = sampleStream
                    .observeOn(Schedulers.io())
                    .subscribe(new Subscriber<String>() {
                        @Override
                        public void onCompleted() {
                            logger.error("HystrixSampleSseServlet: ({}) received unexpected OnCompleted from sample stream", getClass().getSimpleName());
                            moreDataWillBeSent.set(false);
                        }

                        @Override
                        public void onError(Throwable e) {
                            moreDataWillBeSent.set(false);
                        }
                      
                        /** 主要输出逻辑 */
                        @Override
                        public void onNext(String sampleDataAsString) {
                            if (sampleDataAsString != null) {
                                try {
                                    // 默认隔 500ms 输出一次监控信息
                                    writer.print("data: " + sampleDataAsString + "\n\n");
                                    // explicitly check for client disconnect - PrintWriter does not throw exceptions
                                    if (writer.checkError()) {
                                        moreDataWillBeSent.set(false);
                                    }
                                    writer.flush();
                                } catch (Exception ex) {
                                    moreDataWillBeSent.set(false);
                                }
                            }
                        }
                    });

            while (moreDataWillBeSent.get() && !isDestroyed) {
                try {
                    Thread.sleep(pausePollerThreadDelayInMs);
                    //in case stream has not started emitting yet, catch any clients which connect/disconnect before emits start
                    writer.print("ping: \n\n");
                    // explicitly check for client disconnect - PrintWriter does not throw exceptions
                    if (writer.checkError()) {
                        moreDataWillBeSent.set(false);
                    }
                    writer.flush();
                } catch (Exception ex) {
                    moreDataWillBeSent.set(false);
                }
            }
        }
    } finally {
        decrementCurrentConcurrentConnections();
        if (sampleSubscription != null && !sampleSubscription.isUnsubscribed()) {
            sampleSubscription.unsubscribe();
        }
    }
}

要做的是把这个类针对 http 输出的逻辑改成数据监控的逻辑,如推到 mq 或者直接写入文本中。

这样历史监控数据保存下来了, 材料应准备好,如何分析就看自己的了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,644评论 18 139
  • (git上的源码:https://gitee.com/rain7564/spring_microservices_...
    sprainkle阅读 9,342评论 13 33
  • 1.ios高性能编程 (1).内层 最小的内层平均值和峰值(2).耗电量 高效的算法和数据结构(3).初始化时...
    欧辰_OSR阅读 29,356评论 8 265
  • 冬天来了,似乎还没来,天气有点热,心情有点冷。冬季的夜晚早早到来,黑夜,一整片的黑夜覆盖了我所生活的街区,车灯也是...
    小鸿阅读 133评论 0 1
  • #清凉法语# 有好处的事情不要独占 有好处的事情,不要一个人都占完,你一个人拿光了所有的好处,得罪的人也一定很多。...
    xcy无名阅读 294评论 0 0