Coflow-Aware Dynamic Routing for SDN-based Data Center Networks
一 文章概述
这篇文章从路由层面研究Coflow调度问题,主要将Coflow中的流调度问题抽象成了NP-hard问题——multi-commodity flow问题,同时使用松弛方法来解决这个问题。使用了模拟退火的方法来得到近似最优的流调度方案。
二 这篇文章主要贡献
这篇文章主要贡献有以下几个:
- 将Coflow调度问题抽象为了NP-hard问题,并且使用目前已有的松弛方法。
- 使用模拟退火算法求解该调度问题
三 回答四个问题
1 该文章解决的核心问题?前人使用的方法为什么不能解决本文提出的问题,困难在哪?本文提出的方法为什么能够有效解决这些问题?
该文章解决的核心问题是Coflow在路由调度层面的问题。前面更多的关于Coflow的工作还没有到传输层进行,这个问题的困难主要是传输层要识别和区分不同的Coflow。本文使用SDN,自定义头部字段解决了coflow信息在路由层可见,同时使用SDN控制器实现模拟退火算法来获得近似最优的路由策略。
2 该核心问题的解决带来了什么冲击?正负面都有哪些影响?
这个问题的解决主要是将Coflow调度在传输层实现,将整个问题抽象为一种常见的NP-hard问题。提出了使用SDN进行传输层调度的具体实现。
但是本文使用的模拟退火方法相对来说,计算复杂度等都使得可行性不高,方向更加偏理论层面。
3 作者如何进行验证?数学推导还是实验测试?是否完备?如果你进行验证,你会采取什么办法?如果你的方法和本文不一样,思考作者为什么不采用你想的方法?采用你想的方法,会有什么困难?如果你用文中方法,你会遇到什么困难?
使用mininet搭建小的fat-tree拓扑进行模拟实验。主要从coflow的数目,coflow的大小以及coflow的宽度几个方面,对比了ECMP,Hedera,Rapier,本文方法的性能。另外还比较了本文算法与Repair之间的计算代价。
如果我进行验证,也会采用实验进行,由于硬件限制会使用模拟的方法,但是会找一个比较真实的Coflow的workload,同时不会仅仅从CCT一个指标进行对比。另外会有在线算法与离线算法的实验。
但是本文作者没有提出在线离线的区别。本文的方法也很难实际实现。
如果我用文中的方法,我感觉算法本身复杂度是否成为瓶颈是最难以讨论的问题,算法的计算开销怎么对比评价,文中的图也很难说明问题。
4 找本文不完善的地方,是否还有可改进的空间?
本文提出的方法缺乏创新性。将Coflow调度抽象为NP-hard问题,再对问题进行松弛,最后使用模拟退火实现。所有的工作基本上是现成的,没有什么本文创新的东西。改进的空间就是提出更可行的启发式方法,同时实验部分实际上还是比较薄弱的,workload等等都没有说清楚,指标也比较单一。另外对于算法部分,没有讲清楚离线在线算法具体怎么实现,只是大概讲了模拟退火的过程。
总的来看这篇论文还是有点不可行,实验结果存疑