Sentinel流量控制之匀速排队和预热

在前面一篇文章写了默认的DefaultNode的实现方法,现在讲解剩余的几种方式。

RateLimiterController 匀速排队

重要参数

public class RateLimiterController implements TrafficShapingController {
    // 排队等待的最大超时时间,如果等待时间超过该时间,就会抛出FlowException
    private final int maxQueueingTimeMs;
    //设置的阈值,以QPS为例,即1s中可以通过的数量
    private final double count;
    //上一次成功通过的时间戳  
    private final AtomicLong latestPassedTime = new AtomicLong(-1);
 public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        // 当需要的令牌数小于等于0,直接通过
        if (acquireCount <= 0) {
            return true;
        }
        //当阈值小于等于0时,拒绝
        if (count <= 0) {
            return false;
        }
        long currentTime = TimeUtil.currentTimeMillis();
        // 根据本次请求的令牌数计算两个请求的间隔时间  
        // 1.0 / count * 10000 即一个令牌消耗的时间(毫秒), 再乘以所需的令牌数,得到本次请求要间隔的时间
        long costTime = Math.round(1.0 * (acquireCount) / count * 1000);
        // 计算该请求所期望到达时间
        long expectedTime = costTime + latestPassedTime.get();
        //如果小于当前时间,没有超出阈值,
        if (expectedTime <= currentTime) {
            // 此处可能存在争用,但可以
            //更新上次通过事件为当前时间
            latestPassedTime.set(currentTime);
            return true;
        } else {
            // 如果expectedTime大于当前时间,说明还没到令牌发放时间,当前请求需等待, 因为每隔一个时间产生一个令牌,超过了当前时间,说明期间产生的令牌不够
            long waitTime = costTime + latestPassedTime.get() - TimeUtil.currentTimeMillis();
            //计算的需要等待的时间超过了最大排队等待时间,就拒绝通过,并抛出FlowException异常
            if (waitTime > maxQueueingTimeMs) {
                return false;
            } else {
               // 更新时间,CAS操作,可能会出现争抢,导致多次重试
                long oldTime = latestPassedTime.addAndGet(costTime);
                try {
                   // 所以还要判断等待时间
                    waitTime = oldTime - TimeUtil.currentTimeMillis();
                    if (waitTime > maxQueueingTimeMs) {
                        latestPassedTime.addAndGet(-costTime);
                        return false;
                    }
                    // 线程等待
                    if (waitTime > 0) {
                        Thread.sleep(waitTime);
                    }
                    return true;
                } catch (InterruptedException e) {
                }
            }
        }
        return false;
    }

WarmUpController 预热

Sentinel的"warm-up"的实现是基于Guava的算法。

但是,Guava的实施着重于调整请求间隔,类似于漏斗。Sentinel更注重控制每秒的传入请求数,而不计算其间隔,这类似于令牌桶算法。

桶中的剩余令牌用于衡量系统的可用性。假设系统每秒可以处理b个请求。每秒钟b个令牌将被添加到存储桶中,直到存储桶已满。当系统处理请求时,它会从存储桶中获取令牌。存储桶中剩余的令牌越多,系统的利用率就越低; 当令牌桶中的令牌超过某个阈值时,我们将其称为“饱和”状态。

根据Guava的理论, 有一个线性方程可以写成y = m * x + b,其中y(aka y(x))或qps(q))是我们在饱和周期( 例如3分钟)所希望的Qps,m是从冷(最小)速率到稳定(最大)速率的变化速率,x(或q)是占用令牌。

tips: 以上是在官方注释文档翻译的。

重要变量:

public class WarmUpController implements TrafficShapingController {
    //流量规则设置的阈值
    protected double count;
    //冷却因子,默认为3
    private int coldFactor;
    //警告token,与Guava中的RateLimiter的thresholdPermits对应,超过这个值后进入了预热阶段
    protected int warningToken = 0;
    //最大的令牌数和RateLimiter的maxPermits对应
    private int maxToken;
    //斜线斜率
    protected double slope;
    //当前存储的令牌数
    protected AtomicLong storedTokens = new AtomicLong(0);
    //最后更新令牌的时间
    protected AtomicLong lastFilledTime = new AtomicLong(0);

构造方法:


public WarmUpController(double count, int warmUpPeriodInSec, int coldFactor) {
        construct(count, warmUpPeriodInSec, coldFactor);
}

private void construct(double count, int warmUpPeriodInSec, int coldFactor) {

        if (coldFactor <= 1) {
            throw new IllegalArgumentException("Cold factor should be larger than 1");
        }

        this.count = count;

        this.coldFactor = coldFactor;

        // thresholdPermits = 0.5 * warmupPeriod / stableInterval.
        //其中 1 / count 就是 stableInterval
        warningToken = (int)(warmUpPeriodInSec * count) / (coldFactor - 1);
        // / maxPermits = thresholdPermits + 2 * warmupPeriod /
        // (stableInterval + coldInterval)
       // 其中 coldInterval = 3 *  stableInterval ,所以  stableInterval + coldInterval = 4 *  stableInterval 而 stableInterval =  1 / count, 所以 stableInterval + coldInterval = 4 * (1/count) ,就可以得到下面的公式
        maxToken = warningToken + (int)(2 * warmUpPeriodInSec * count / (1.0 + coldFactor));
        // slope
        // slope = (coldIntervalMicros - stableIntervalMicros) / (maxPermits
        // - thresholdPermits);
        slope = (coldFactor - 1.0) / count / (maxToken - warningToken);

    }

在进行流量控制时会触发下面的方法:

public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        //获取当前节点已通过的QPs(调用的是按秒级统计)
        long passQps = (long) node.passQps();
        // 当前时间窗口的前一个窗口记录的通过的QPS(调用的是按分钟统计的)
        long previousQps = (long) node.previousPassQps();
        //更新 storedTokens 与 lastFilledTime 的值(最后减去了上一秒通过的令牌数QPS)
        syncToken(previousQps);

        // 开始计算它的斜率
        // 如果进入了警戒线,开始调整他的qps
        long restToken = storedTokens.get();
        if (restToken >= warningToken) {
            long aboveToken = restToken - warningToken;
            // 消耗的速度要比warning快,但是要比慢
            // current interval = restToken*slope+1/count
            // int temp = aboveToken * slope + 1.0 / count 计算当前生成一个令牌的时间
            // 1  / temp 即按照当前速率,在1s中可以产生的令牌数
            double warningQps = Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));
            // 当前通过的数加上本次需要的令牌小于warningQps可以通过
            if (passQps + acquireCount <= warningQps) {
                return true;
            }
        // 当当前处于稳定状态时
        } else {
            // 判断当前通过数加上本次需要的数布不超过阈值,可以通过
            if (passQps + acquireCount <= count) {
                return true;
            }
        }

        return false;
    }

注意:调用者是rollingCounterInMinute,它是统计分钟级别的,有60个窗口,每个窗口代表1s的数据。

@Override
    public double previousPassQps() {
        return this.rollingCounterInMinute.previousWindowPass();
}

public long previousWindowPass() {
        //更新时间窗口,去除过期时间
        data.currentWindow();
        WindowWrap<MetricBucket> wrap = data.getPreviousWindow();
        if (wrap == null) {
            return 0;
        }
        return wrap.value().pass();
}

public WindowWrap<T> getPreviousWindow() {
        return getPreviousWindow(TimeUtil.currentTimeMillis());
}

public WindowWrap<T> getPreviousWindow(long timeMillis) {
        if (timeMillis < 0) {
            return null;
        }
        // windowLengthInMs为一个时间窗口的长度,因为是分钟级别统计的,所以是1s
        // 计算当前时间前1s,即前一个时间窗口的下标位置
        int idx = calculateTimeIdx(timeMillis - windowLengthInMs);
        timeMillis = timeMillis - windowLengthInMs;
        WindowWrap<T> wrap = array.get(idx);
        // 检查是否不建议使用存储桶,这意味着该存储桶至少在整个窗口时间段(在这里是1分钟)内都已落后
        if (wrap == null || isWindowDeprecated(wrap)) {
            return null;
        }

        if (wrap.windowStart() + windowLengthInMs < (timeMillis)) {
            return null;
        }
        return wrap;
}
protected void syncToken(long passQps) {
        long currentTime = TimeUtil.currentTimeMillis();
        // 计算出当前时间秒的最开始时间
        currentTime = currentTime - currentTime % 1000; 
        // 最后更新令牌的时间
        long oldLastFillTime = lastFilledTime.get();
        // 如果当前时间小于等于上次发放许可的时间,则跳过,无法发放令牌,即每秒发放一次令牌
        if (currentTime <= oldLastFillTime) {
            return;
        }
        //当前存放的令牌数
        long oldValue = storedTokens.get();
        //计算新的存放的令牌数
        long newValue = coolDownTokens(currentTime, passQps);
        
        if (storedTokens.compareAndSet(oldValue, newValue)) {
            // 更细剩余令牌数量,即减去上1秒通过的令牌
            long currentValue = storedTokens.addAndGet(0 - passQps);
            if (currentValue < 0) {
                storedTokens.set(0L);
            }
            lastFilledTime.set(currentTime);
        }

    }
private long coolDownTokens(long currentTime, long passQps) {
        // 当前存放的令牌数
        long oldValue = storedTokens.get();
        long newValue = oldValue;

        // 添加令牌的判断前提条件:
        // 当令牌的消耗程度远远低于警戒线的时候
        if (oldValue < warningToken) {
            newValue = (long)(oldValue + (currentTime - lastFilledTime.get()) * count / 1000);
        // 当超过警戒线后,进入了预热阶段
        } else if (oldValue > warningToken) {
            //这里不是很理解,欢迎大家交流
            if (passQps < (int)count / coldFactor) {
                newValue = (long)(oldValue + (currentTime - lastFilledTime.get()) * count / 1000);
            }
        }
        return Math.min(newValue, maxToken);
    }

WarmUpRateLimiterController

设计上是上面介绍的RateLimiterController和WarmUpController结合起来

public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        long previousQps = (long) node.previousPassQps();
        syncToken(previousQps);

        long currentTime = TimeUtil.currentTimeMillis();

        long restToken = storedTokens.get();
        long costTime = 0;
        long expectedTime = 0;
    
        主要时下面与RateLimiterController不同
        if (restToken >= warningToken) {
            long aboveToken = restToken - warningToken;

            // current interval = restToken*slope+1/count
            double warmingQps = Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));
            costTime = Math.round(1.0 * (acquireCount) / warmingQps * 1000);
        } else {
            costTime = Math.round(1.0 * (acquireCount) / count * 1000);
        }
        主要时上面与RateLimiterController不同
        expectedTime = costTime + latestPassedTime.get();

        if (expectedTime <= currentTime) {
            latestPassedTime.set(currentTime);
            return true;
        } else {
            long waitTime = costTime + latestPassedTime.get() - currentTime;
            if (waitTime > timeoutInMs) {
                return false;
            } else {
                long oldTime = latestPassedTime.addAndGet(costTime);
                try {
                    waitTime = oldTime - TimeUtil.currentTimeMillis();
                    if (waitTime > timeoutInMs) {
                        latestPassedTime.addAndGet(-costTime);
                        return false;
                    }
                    if (waitTime > 0) {
                        Thread.sleep(waitTime);
                    }
                    return true;
                } catch (InterruptedException e) {
                }
            }
        }
        return false;
}

实际上,就是RateLimiterController中的代码,然后加入了预热的内容。

在RateLimiterController中,单个请求的costTime是固定的,就是1/count。

但是在这里,加入了WarmUp的内容,通过令牌数量,来判断当前系统的QPS应该是多少,如果当前令牌书超过了warnTokens,那么系统的最大QPS容量已经低于我们预设的QPS了,相应的,costTime就会延长。

至此,关于Sentinel中的限流部分就讲解完了。后面将会介绍降级部分。

参考文章:

RateLimiter 源码分析(Guava 和 Sentinel 实现)

Sentienl 流控效果之匀速排队与预热实现原理与实战建议

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容