写文章
注册
登录
首页
下载App
会员
IT技术
发简信
079aea66745a
3
关注
0
粉丝
0
文章
0
字数
0
收获喜欢
1
总资产
IP属地:河南
关注的专题/文集/连载 2
喜欢的文章 1
雨田君的记事本
docker容器中deepspeed多机多卡集群分布式训练大模型
众所周知,大模型的训练需要大量的显存资源,单卡很容易就爆了,于是就有了单机多卡、多机多卡的训练方案。本文主要是介绍如何使用deepspeed框架做多机多卡的分布式训练。 由于...
7261
0
6
暂无个人介绍
他关注的专题/文集/连载
他喜欢的文章