并发下资源的访问控制

背景

在开发微信公众号的时候,会和access_token打交道,参照微信的文档

access_token是公众号的全局唯一票据,公众号调用各接口时都需使用access_token。开发者需要进行妥善保存。access_token的存储至少要保留512个字符空间。access_token的有效期目前为2个小时,需定时刷新,重复获取将导致上次获取的access_token失效。

按照文档上推荐的做法,需要一个用来获取和刷新access_token的中控服务器,其他业务逻辑服务器所使用的access_token均来自该中控服务器。

出于安全的考虑,微信对于获取access_token的调用有一定的次数限制,超过这个限制,就无法再刷新token。

问题

在实际开发中,中控服务器的做法如下图

请求access token流程

假设这样一种情景,在redis中缓存的token刚好过期时,第三方向中控服务器同时发送了大量的请求。为了让问题简化,这里假设收到了A和B两条请求。

中控服务收到请求A时,查询缓存,没有命中,于是调用微信api,重新获取token,然后写入缓存,实测这个过程大概需要0.1到0.2秒(这个值和所处的网络环境也有关系)。在请求A将token写入缓存前,请求B来了,查询redis,也没有命中,也会调用微信的api来重新获取token。

实际上在业务中,只需要调用一次微信api来获取token即可。可是在上面的例子中,却调用了两次。如果并发量足够大,让中控服务反复去调用微信的api,很有可能就会超出微信的限制,一旦这种情况发生,对于业务的运营将是灾难性的。

测试

为了说明上面的问题,笔者编写了一个小的例子来模拟这种情况。
服务端采用Django,客户端使用go语言来高并发调用服务端的接口。

服务端

服务端代码,这里只是列出关键代码,其他一些配置项之类的代码在这里略过不计。
创建项目

django-admin startproject accessTokenTest
python manage.py startapp index

编写返回token的api

# view函数
def index(request):
    cache.incr(settings.CounterKey)
    token = cache.get(settings.TokenKey)
    if token is None:
        token = create_access_token()
        cache.set(settings.TokenKey, token, 5 * 60)
    return HttpResponse(json.dumps({'token': token}), content_type='text/json')
        
# 模拟调用微信api生成access token
def create_access_token():
    time.sleep(0.3)
    cache.incr(settings.CreateKey)
    return str(uuid4())

测试的例子采用redis作为缓存,通过sleep来模拟一个网络请求,并且将请求的次数和生成token的次数存在redis里,便于我们得到测试结果。

使用gunicorn,启用4个进程来模拟服务端

gunicorn accessTokenTest.wsgi --workers 4
[2016-11-04 13:04:29 +0800] [12720] [INFO] Starting gunicorn 19.6.0
[2016-11-04 13:04:29 +0800] [12720] [INFO] Listening at: http://127.0.0.1:8000 (12720)
[2016-11-04 13:04:29 +0800] [12720] [INFO] Using worker: sync
[2016-11-04 13:04:29 +0800] [12723] [INFO] Booting worker with pid: 12723
[2016-11-04 13:04:29 +0800] [12724] [INFO] Booting worker with pid: 12724
[2016-11-04 13:04:29 +0800] [12725] [INFO] Booting worker with pid: 12725
[2016-11-04 13:04:29 +0800] [12726] [INFO] Booting worker with pid: 12726

客户端通过GET请求http://127.0.0.1:8000 来请求token

客户端

客户端代码如下

// filename accessToken.go

package main

import(
    "net/http"
    "encoding/json"
)

type AccessToken struct {
    Token string
}

func main(){
    channel := make(chan error)
    for ;;{
        token := new(AccessToken)
        go func(){
            channel <- getJson("http://127.0.0.1:8000", token)
        }()

    }
}

func getJson(url string, target interface{}) error {
    r, err := http.Get(url)
    if err != nil {
        return err
    }
    defer r.Body.Close()
    return json.NewDecoder(r.Body).Decode(target)
}

编译后生成可执行文件accessToken

在测试开始前,启动redis服务,设置对应的key

127.0.0.1:6379[1]> persist ":1:counter"
(integer) 0
127.0.0.1:6379[1]> persist ":1:create"
(integer) 0

启动客户端,进行测试,运行一段时间后,手动杀死

./tokenTest
^C

查看测试数据,可以看到在测试的时间内,服务端一共收到了客户端1522次请求,4次生成了新的token。

127.0.0.1:6379[1]> get ":1:create"
"4"
127.0.0.1:6379[1]> get ":1:counter"
"1522"

分析问题

这个场景要求获取access token这个操作必须是原子的。
可以进一步得抽象为在某段时间内对"access_token"这个资源只能有一个进程进行访问。

解决方法

说到原子操作,笔者第一反应就是信号量。下面我们将使用信号量来解决这个问题。
采用posix_ipc模块,只修改服务端的代码

为了确保每次运行项目,信号量的状态保持一致,修改index/apps.py这个文件,在启动时初始化信号量。

服务端v2

from posix_ipc import Semaphore, ExistentialError, O_CREAT

class IndexConfig(AppConfig):
    name = 'index'

    def ready(self):
        try:
            sem = Semaphore(settings.TokenSemaphoreName)
            sem.unlink()
        except ExistentialError:
            pass
        finally:
            Semaphore(settings.TokenSemaphoreName, flags=O_CREAT, initial_value=1)

修改视图函数,如下

def index(request):
    cache.incr(settings.CounterKey)
    sem = Semaphore(settings.TokenSemaphoreName)
    sem.acquire()
    token = cache.get(settings.TokenKey)
    if token is None:
        token = create_access_token()
        cache.set(settings.TokenKey, token, 5 * 60)
    sem.release()

    return HttpResponse(json.dumps({'token': token}), content_type='text/json')

测试2

在测试前,清空之前的数据,并删除缓存的token

127.0.0.1:6379[1]> del ":1:token"
(integer) 1
127.0.0.1:6379[1]> set ":1:counter" 0
OK
127.0.0.1:6379[1]> set ":1:create" 0
OK

和之前一样启动服务端和客户端,在运行一段时间后,退出客户端。
查看结果,可以看到客户端请求了980次,服务端只生成了一次token,这个结果正是我们想要的。

127.0.0.1:6379[1]> get ":1:counter"
"980"
127.0.0.1:6379[1]> del ":1:create"
(integer) 1

多主机场景

看起来问题好像得到解决了?并没有!

在实际的生产环境中,为了保持服务的高可用,经常会使用负载均衡这样的技术。

负载均衡

在这样的场景下使用上面的方案,每台服务器都会生成自己的信号量,在高并发的情况下依然会出现多次请求access token的情况。

测试

这里使用nginx来实现负载均衡,使用docker来模拟多主机。

nginx的相关配置如下

...
upstream back {
    server 127.0.0.1:8080;
    server 127.0.0.1:8087;
}
...
...
location / {
     proxy_pass http://back;
}
...

启动container

CONTAINER ID        IMAGE                    COMMAND                  CREATED             STATUS                   PORTS                    NAMES
c845d3123a08        python:2.7               "python2"                40 minutes ago      Up 10 minutes            0.0.0.0:8080->8000/tcp   python

在container中启动线程

gunicorn accessTokenTest.wsgi --workers 4 -b 0.0.0.0:8000

同时在宿主机上也启动线程

gunicorn accessTokenTest.wsgi --workers 4 -b 0.0.0.0:8087

和之前一样,测试前清除缓存中的token,并将counter和create设置为0

在宿主机上启动客户端,在token缓存失效前断掉
查看结果,可以看到客户端一共请求了2062次,生成了2次token,和预期的一致。

127.0.0.1:6379[1]> get ":1:create"
"2"
127.0.0.1:6379[1]> get ":1:counter"
"2062"

在多主机的情况下,如果要确保请求access token的原子性,需要一种“分布式锁”。

新的解决方案

采用redis来辅助实现分布式锁。尽管有着一定的争论,但是能满足现在的需求。

实现的算法来自redis作者的文章,这里直接采用redlock-py

服务端v3

def index(request):
    cache.incr(settings.CounterKey)
    dlm = Redlock([{"host": "your-host-ip", "port": 6379, "db": 0}, ])
    my_lock = dlm.lock("my_resource_name", 1000)
    token = cache.get(settings.TokenKey)
    
    if token is None:
        token = create_access_token()
        cache.set(settings.TokenKey, token, 5 * 60)
    dlm.unlock(my_lock)

    return HttpResponse(json.dumps({'token': token}), content_type='text/json')

测试3

测试环境和之前一样。更新代码后,重启启动服务端,处理之前的redis缓存

启动客户端一段时间后断掉。
查看测试结果, 客户端一共请求了88次,生成了1次token,和预期也是一致的

127.0.0.1:6379[1]> get ":1:counter"
"88"
127.0.0.1:6379[1]> get ":1:create"
"1"
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351

推荐阅读更多精彩内容