论文题目:RDMA Congestion Control: It’s Only for the Compliant
文章时间:2021年10月前
会议/期刊:CLOUD21
作者背景: 杜克大学
笔记时间:2021年11月08日周一
论文地址:https://danyangzhuo.com/papers/CLOUD21-RDMA.pdf
通过用户的恶意操作,获取不正当的流量优势,提出了攻击的方法和可能的解决方案
对比的主要两个CC算法,DCQCN和HPCC
论文题目:Memory Demands in Disaggregated HPC: How Accurate Do We Need to Be?
文章时间:2021年11月,应该是最近的文章吧
会议/期刊:未知,谷歌学术推荐
作者背景: 巴萨罗那超算中心
笔记时间:2021年11月08日周一
论文地址:http://paul-carpenter.org/vieira2021pmbs.pdf
研究,当HPC环境中的内存变为Disaggregated memory时,会有什么影响。
将内存化为内存池,计算通过内存池来获取存储资源。用ordinary load-store instructions /RMDA来传输输数据。
工作是用slurm的模拟器来做的,模拟的插件是自己先前的工作
F. V. Zacarias, P. Carpenter, and V. Petrucci, “Improving hpc system throughput and response time using memory disaggregation,” in 2021 IEEE 27th International Conference on Parallel and Distributed Systems(ICPADS). IEEE, 2021.
[21] “Disaggregated memory slurm simulator and allocation policy.” https://github.com/felippezacarias/slurm simulator, 2021, accessed: 2021-04-08
方法论
模拟的作业数据集:CIRNE Comprehensive Model [23]
W. Cirne and F. Berman, “A comprehensive model of the supercomputer workload,” in Proceedings of the Fourth Annual IEEE International Workshop on Workload Characterization. WWC-4 (Cat. No. 01EX538). IEEE, 2001, pp. 140–148扩展内存过估计的模拟器
(1)按照固定比例过估计
(2)独立同分布的过估计对系统吞吐的影响
4.内存过估计和响应时间的关系
相关工作
1.内存解耦
- 资源分配
- 获取/定价机制
结论
Disaggregated Memory 是正在发展的新技术,可以灵活细粒度的分配物理内存。HPC用户如要使用Disaggregated Memory的话,需要用户对自己作业的内存使用情况有个正确的估计,错误的估计会导致吞吐量和延迟的问题,我们根据假设做了多种的实验。
本文是研究如何将Disaggregated Memory引入HPC的一个前导工作,用户如果能提供准确的内存使用数据,应该得倒奖励,奖励可以是优先级,并行作业数量,或者更大的分配核。
有一说一,这个论文的图,确实没看懂。
论文题目:PREP: Predicting Job Runtime with Job Running Path on Supercomputers
文章时间:2021年08月前
会议/期刊:ICPP 2021
作者背景: 西南科技大学,超算中心
笔记时间:2021年11月08日周一
论文地址:https://dl.acm.org/doi/abs/10.1145/3472456.3473521
利用作业的运行文件路径作为预测作业的一个参数,效果可以达到预测88%
随机森林才82%
future work,深挖作业日志提高预测准确率。