针对all-reduce的优化

这篇文章针对张量并行的all-reduce操作，通过多波束的叠加以及空中计算实现多设备信息的快速聚合。
优化目标是快速聚合的信息与标准信息mse最小，约束条件为计算功耗以及通信功耗，再加上模型分割的总和是1。

传统方法整体来说都是在设备上升到8个的时候，因为设备通信的问题导致推理速度变慢了，它这个方法确实能极大程度的减少通信，而且对模型精度造成影响的来源因该是通信误差。
感觉是两个赛道的问题，这不是通信机制的改变，仍然是全通信。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

DB4AI研究方向整理分类及论文汇总（数据库顶会近三年23-25论文SIGMOD、VLDB、I...
DB4AI，即Database for AI，是用数据库和数据管理的技术提升AI流水线全过程性能的技术，包括前期的...
Caucher阅读 3,843评论 0赞 2
解密6G“超级大脑”：无线大模型如何开启AI原生通信时代?
大家好！今天想和大家深入聊一聊未来通信领域最激动人心的变革之一：第六代移动通信（6G）将如何拥有一个“超级大脑”？...
6G智能无线通信阅读 676评论 0赞 0
联合学习：Android去中心化的分布式机器学习
转载请注明来源该文章翻译自： Federated Learning: Collaborative Machine...
JulyZhang阅读 10,553评论 0赞 5
Taurus: 面向机器学习的数据面架构
日益复杂的网络和多样化的工作负载要求网络内置更多的自动化决策能力，通过可编程网络设备在用户面支持机器学习工作负载就...
DeepNoMind阅读 5,450评论 0赞 1
【求职】我的“华为”求职路
正文之前华为是我的一个分叉口，如果我中了华为，那么考研就将成为过去，因为研究生真的不一定有华为好，所以下面是我准...
张照博阅读 4,654评论 0赞 11

赞1赞

赞赏

手机看全文