爱串门的小马驹 - 简书

发简信

爱串门的小马驹

0
关注
0
粉丝
4
文章
5143

字数
4

收获喜欢
0

总资产

IP属地：浙江

爱串门的小马驹

模型训练时间预测，计算量估计 Scaling Laws for Neural Language Models
一、模型计算量 C ≈ 6N*D 其中C表示训练语言模型所需的总计算量，N表示模型参数量，D表示用于训练的语料总量，6表示每训练一个token所需的浮点计算量约为6N，其中前...

383 0 1
爱串门的小马驹

NCCL源码分析1：单进程单设备使用/调用案例官网案例详解
NCCL使用/调用步骤源码解读（单设备单进程为例）：视频教程 1.1 NCCL官网案例源码详解One Device per Process or Thread_哔哩哔哩_b...

192 0 3

爱串门的小马驹

MegaScale: Scaling Large Language Model Training 万卡集群训练平台设计方案
一、为什么要万卡训练集群：大语言模型贼牛逼这个就不强调了哈，机器翻译，人机会话表现出巨大潜力和应用价值。模型大小和训练数据大小决定了模型能力，为实现最先进的模型，人们已经致...

327 0 0
爱串门的小马驹

ZeRO系列数据并行训练方案视频教程，ZeRO++对ZeRO3的通信优化
ZeRO++是对ZeRO3的通信优化优化了以下三个方面： 1、每个服务器有完整的模型参数，消除跨服务器的All_gather操作； 2、通信时，基于块的量化，模型参数从FP...

297 0 0
爱串门的小马驹

@IT·互联网
若锦编，70360 篇文章，2660155 人关注

Hi，很高兴在@IT·互联网专题遇见你。收录范围：收录IT&互联网行业观察与思考，数码产品极客体验分析等类型文章投稿须知：https://www.jianshu.com/p/4edc76104c27 专题主编：@若锦 https://www.jianshu.com/u/e4c63b354a77 官方社群：可联系添加 @若锦加入专题官方社群交流、学习，添加时备注简书ID。
爱串门的小马驹

个人介绍

分布式、通信、AI框架、集群学习分享，不定期更新