[MPI/Net Perf]On Network Locality in MPI-Based HPC Applications

论文题目:On Network Locality in MPI-Based HPC Applications
文章时间:2020年8月前
会议/期刊:ICPP '20
作者背景: 德国海德堡大学
笔记时间:2021年10月31日周天
论文地址:https://dl.acm.org/doi/abs/10.1145/3404397.3404436


Abtract
通过互连网络的数据移动在延迟和能量上超过本地内存访问多个数量级。当很多优化聚焦于提升内存访问次数,网络大距离传输可以轻轻松松dash这些改进,导致整体代价的提升。因此,对Network Locality的深入理解是进一步优化的关键,比如改进ranks对物理实体的映射。
本文中,我们聚焦于于硬件无关的应用层和通用网络结构的Locality。为了量化前者,我们提出了两个新的度量衡,rank Locality和 selectivity。我们的研究选择了16个exascale proxy mini app,最大到了1152个rank。我们对他们的trace进行了MPI空间层面的分析。在三种不同的网络结果,tori,fat tree,dragonfly 评估了我们的方案。本文工作给予大规模的实验设计,基于不同的应用规模和拓扑。

大多数的数据在10个以内的ranks传输。对于小rank的应用,3Dtorus最好,对于大rank的应用,fattree更好。一般情况下,网络是高度未利用的。93%的情况下,网络利用率超过1%。总之,这意味着统计数据可以辅助选择更高级的映射,比如使得通讯量多的ranks在靠近的物理实体上,这可以最小化全部的包的hops,因此可以提升延迟和减少拥塞的概率。

第一章 Intro

第三章 相关工作

使用模型来代表并行应用的通信行为的工作有17.不考虑并行计算的关系来描述通信是不完整的。应用的行为常常是无规律动态的,因此模拟工具主要是用于理解通信行为。

HPC应用的locality特征主要考虑的是内存的locality,有着数量众多的研究,有关于HPC对内存延迟和带宽的研究12,4。13描述了对HPC应用时间和空间locality的定义。还有分析HPC应用在GPU分配和MPI的locality。11

考虑并行的通信特征,2介绍了几个关于通信特征的度量衡,包括消息产生的频率,消息的空间分布,消息的长度等。利用统计回归模型,分析网络活动日志,消息传播时间和空间分布是确定的。MPI通信的locality被工作6分析过,主要聚焦于event locality,消息终点的locality,和消息大小的locality。

通信特征相关的文章有8,9,15,18

第四章 方法论

为了深入理解HPC exascale应用的通讯特征,分析了大量的MPI的trace。下文介绍了分析的应用和分析的过程。介绍了两种新的度量衡。
用热力图来衡量MPI应用的locality,适合小规模rank。现有的文献调研发现缺乏对网络特征的度量衡,我们介绍了两个度量衡。用于理解通信的空间关系和如何利用它们进一步做优化。

4.1 MPI层
在MPI层,不存在消息在网络传播的具体路径信息,消息长度和网络利用率。但是关于locality的insight可以在这层看到。比如确定特定的通信参与者或通讯组们帮助提升映射和减少全部网络跳数。

4.1.1 locality
rank locality代表MPI层两个rank间的空间距离。距离越近,locality越大,直接邻居的locality是100%,这个度量衡忽略了拓扑和映射关系,及对应的影响。

只有点对点通信考虑locality。

4.1.2 selectivity
selectivity描述了在某个应用程序中有多少个合作伙伴等级控制着一个等级的通信。对于给定的source rank,这个度量是通过确定目标rank和其他rank通信的数量,排序后在阈值内的数量来计算。
这个度量衡也只是描述点对点通信。少量的rank贡献了主要的通信。

4.2 拓扑locality

第七章 讨论

在硬件不感知的应用层,我们引入了rank locality and selectivity,大多数应用的selectively非常low,rank locality随着ranks的数量减少而significantly减少。这意味着尽管只有很少的通讯参与者,数据分布不局限于邻居rank。通讯模式的一个重要的因素是 the dimensionality of the underlying problem。这个观察也在多核的研究中被证实,节点间的网络流量很多。因此,将秩连续地映射到给定的拓扑并没有利用小选择性的好处,因为通信伙伴很可能在空间上是分开的。为了减少网络流量和从on-ship通讯上获益,深度理解通讯对是必要的,大多数应用程序的低选择性表明,只有使用优化的映射才能显著降低流量。正如维数分析所建议的,可以根据给定的应用程序裁剪网络拓扑来进一步减少流量。然而,最佳方法和可能的优化程度在很大程度上取决于应用程序。

Dragonfly的结果没有那么好,可能和他的路由策略有关。

应用层的locality和系统层面的locality没有直接的相关性,所以得倒的启示也不适用于所有的程序。针对相似应用做更细粒度分析是有价值的。

网络的利用率非常低,说明很大一部分的energy被浪费了。总之,研究MPI应用里面的slackness是有用的。

第八章 总结

一些分析


想要阅读的相关文献
2,6,11,13

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容