LEAD:大规模WiFi系统边缘缓存部署策略

姓名:胡娟

学号:20021110092

转载自:https://mp.weixin.qq.com/s/10hILKUphYmvzRIsdb5Ogg

【嵌牛导读】

为了适应移动设备数量的激增和不断增长的数据流量需求,大多数企业场所(如企业、机场和校园)都部署了大规模的 WiFi 系统,为用户提供室内的大范围覆盖和高速互联网体验。作者在本文中针对一个校园网大型 WiFi 系统进行数据分析和建模,以期最大化系统的长期缓存收益(long-term caching gain),即减少回传流量(backhaul traffic)的总量。作者首先对收集到的大量用户网络连接记录数据进行了深入的统计分析,并提出名为 LEAD 的缓存部署策略(Large-scale wifi Edge cAche Deployment),在该策略中,作者首先将大型 AP 群集到大小合适的边缘节点中,然后对边缘级别的流量消耗进行静态测量,并对流量统计数据进行采样,以便精确地描述未来的流量状况;作者最后设计了TEG(Traffic-wEighted Greedy)算法来解决长期缓存收益最大化问题。文章进行了大量以轨迹为驱动的仿真,结果证明了 LEAD 的有效性。

【嵌牛鼻子】

LEAD(Large-scale wifi Edge cAche Deployment),TEG(Traffic-wEighted Greedy)

【嵌牛正文】

大规模WiFi系统边缘缓存部署策略主要挑战:

想要在大规模 WiFi 系统中以经济高效的方式部署边缘缓存,在以下三个方面非常具有挑战性。第一,在大规模的 WiFi 系统中部署边缘缓存要耗费大量的人力和时间资源,不太可能在每个 AP 上部署边缘缓存。因此,高效的缓存配置策略非常重要。第二,AP 的部署范围很广,在用户连接记录和流量消耗方面可能会有明显的特征。如何将有限的缓存存储预算分配给更多的用户,同时减轻后台的负担并不是一件轻而易举的事。一方面,如果将过多的缓存分配给用户关联较少的 AP ,则会浪费缓存资源;另一方面,对于那些用户频繁连接并消耗密集数据流量的热门 AP ,为其分配不足的缓存存储空间可能无法充分释放边缘缓存的潜力。第三,由于网络的动态和用户移动性,接入点的流量消耗是随时间动态变化的,而缓存部署是静态的一次性解决方案,因此在不知道未来流量状况的情况下,很难长期保持最高的缓存收益。

系统描述和问题定义

作者在其所在校园内的 WiFi 系统中进行了大量的数据收集和实验,该 WiFi 系统由 30925km^2区域中的 8000 个 AP 组成,可为 40000 多个用户提供网络连接服务,系统的架构如图 1 所示。


图1 The architecture of the large-scale WiFi system

作者首先提出了一个大规模的 WiFi 缓存增益最大化(Caching Gain Maximization)问题:给定总的缓存存储预算 C ,如何将它们分配给大型 WiFi 系统中的 AP ,使总时间内减少的总回程流量最大?我们将长期持续时间划分为 T 个连续的时隙,并假设系统中有 N 个 AP,记为\Psi =\left\{ AP_{1} ,AP_{2},\cdot \cdot \cdot ,AP_{N}\right\} 。另外,对于 AP_{i} ,假设在时隙 t 期间有 M_{i}^t个用户与 AP 建立了连接,表示为。因此,CGM 问题可以表述为:


数据收集和分析

作者持续两个多月,在 7710 个 AP 中收集了 41119940 条网络连接记录,覆盖 36952 个用户,总数据大小超过 35 GB。通过对数据的深入分析,得出以下结论。

1. 广泛的流量消耗

图 2 显示了 5月8日 - 6月8日以及 6月9日 - 7月9日每个 AP 的平均每日流量消耗,可以看出,两条曲线非常接近,这意味着每天的流量消耗规律相似,如果缓存初始部署策略设计得当,缓存收益可以长期维持。在两条曲线中,每日流量消耗的比例在10^4 KB 和10^{10}KB 之间占 90%以上,流量消耗大于10^9KB 的总比例不超过 10%,这意味着如果可以在流量消耗非常大的那几个 AP 上正确部署缓存,则可以获得相当可观的缓存收益。


图2 AP 流量消耗的 CCDF 曲线

2. AP 受欢迎程度呈指数型分布

作者在本文中提出 AP 流量加权熵的概念来量化一个 AP 的受欢迎程度。具体来说,在某个时间段内与一个 AP 建立连接的用户数越多,消耗的流量越多,则流量加权熵越大,代表受欢迎程度越高。图3展示了两个月中所有 AP 的流量加权熵,可以看出具有相对较大的流量加权熵值(即非常受欢迎)的 AP 的比例很小。这启发我们仅在少数具有最大流量加权熵值的 AP 上部署更多的缓存资源,以提供缓存服务,会取得更好的缓存收益。


图3 AP 流量加权熵的 CCDF 曲线


系统设计

一、 LEAD 策略设计

作者根据上述的数据收集和分析,设计了名为 Clustering Edge Nodes 的聚簇缓存节点策略:根据 AP 的物理位置,将相邻的 AP 聚集成大小合适的边缘节点。当建筑物较小,例如少于 20 个 AP 时,只需在该建筑物中部署一台边缘缓存服务器,即可通过将服务器连接到这些 AP 的 PoE 交换机来覆盖该建筑物中的所有 AP。对于可能具有超过 100 个 AP 的大型建筑物,我们将每个楼层划分为不同的边缘节点,即同一楼层中的 AP 由于物理上彼此靠近而被聚集成一个边缘节点,并且适合于应用边缘节点缓存部署。根据 GPS 定位,作者将分布于校园中 201 座建筑物上的 7710 个 AP 划分到 667 个边缘节点,并在这些节点上进行边缘缓存的部署。


图4 边缘节点的分布地图

二、 TEG 算法提出

经过作者的数据分析得到两个主要结论:第一,每个 AP 的流量消耗在很大的范围内变化,并且 AP 比例在该范围内平均分布,这表明应根据基础流量需求对缓存大小进行异构分配;第二,与单个 AP 相比,一组 AP(按物理位置划分集群)的流量消耗更加稳定,这意味着短期流量统计信息可用于推断未来的长期流量状况。

于是作者提出使用短期流量消耗平均值\mu _{i} 来近似代替边缘节点i的未来长期流量消耗期望,于是可将 CGM 问题重写为:


作者设计了 TEG 算法,以贪心策略迭代地分配缓存存储。具体来说,如图5所示,给定总的缓存存储预算 C,我们首先分配缓存预算的第一个节点e,使e处的缓存收益最大,即 ,以此类推,直到没有缓存预算可用,得到最终缓存分配结果 (c_{1}^C ,c_{2}^C,\cdot \cdot \cdot ,c_{N}^C)。TEG 算法的时间复杂度为 O(N^2C ),考虑到缓存的部署是一次性的解决方案,该复杂度是可以接受的。


图5 TEG算法流程

作者使用 5月8日至 6月8日的用户连接数据作为训练数据集求得\mu _{i} ,将 6月9日至 7月9日的数据作为测试数据集来评估系统性能。作者选取了三种基准策略与本文提出的 LEAD 策略进行对比:Optimal(在已知未来流量消耗下的最优分配策略,这种策略无法实现,仅作为 CGM 问题的上限参考)、Equipartition(系统提供商通常会采用的策略,总缓存预算平均分配给每个边缘节点)、Demographics(根据用户密度分配缓存)。作者以缓存收益率(Caching gain ratio,成功缓存的流量与总消耗流量的比值)为指标来衡量以上四种算法的好坏,结果如图 6所示,可以看出 LEAD 缓存部署策略远远优于 Equipartition 和 Demographics 策略,并已非常接近最优策略,证明了本文策略的有效性。


图6 不同算法的缓存收益率比较

论文出处:

Lyu F , Ren J , Cheng N , et al. Demystifying Traffic Statistics for Edge Cache Deployment in Large-Scale WiFi System[C]// 2019 IEEE 39th International Conference on Distributed Computing Systems (ICDCS). IEEE, 2019.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容