登录注册写文章

Pytorch笔记5-在合适的device上训练模型

Pytorch笔记5-在合适的device上训练模型

在基于PyTorch的深度学习框架中，通常需要将以下内容传到GPU：

模型参数：神经网络模型的权重和偏置。
输入数据：训练和测试时的输入数据张量。
标签数据：对应的标签数据张量（如果有）。
损失函数和优化器状态：虽然损失函数和优化器本身不需要移动到GPU，但它们内部使用的数据和模型参数需要在GPU上。

步骤

1. 设置设备

# 只有一块GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
# 指定某个GPU
device = torch.device("cuda:1")

1. 将模型移动到GPU：

model = MyNeuralNet()
model.to(device)

1. 将输入数据和标签移动到GPU：

inputs = inputs.to(device)
labels = labels.to(device)

1. 损失函数和优化器：

损失函数不需要显式地移动到GPU，因为它会自动处理张量的位置。
优化器(optimizer)需要在模型参数移动到GPU之后定义。

显存管理

由于数据是一批一批地读进显存的，当每个批次的数据被用完之后，GPU显存中的这些数据会被释放，为下一个批次的数据腾出空间。

因此，适当降低批次大小（batch size）是一个常用的方法来节省显存。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

大模型的基础概念知识
一大模型的组成部分大模型通常指规模巨大、参数数量众多的机器学习模型，尤其在深度学习领域，这种模型一般由以...
676eae41b128阅读 5,673评论 1赞 0
二、pytorch主要组成模块——pytorch学习
1. pytorch基础配置 2. 数据读入可以定义自己的Dataset类来实现灵活的数据读取，定义的类需要继承...
一米米倾磬阅读 3,811评论 0赞 0

BLOOM 训练背后的技术
BLOOM 训练背后的技术 @(Engineering Practice) 假设你现在有了数据，也搞到了预算，一切...
MatrixOnEarth阅读 4,318评论 0赞 0
夯实基础，PyTorch 写 GANs
DCGAN TUTORIAL----做项目学pytorch @(PyTorch)[GANs] 教程地址 [TOC]...
VanJordan阅读 8,236评论 0赞 3
神经网络基础篇-3-PyTorch构建及训练模型
TORCH.NN API[https://pytorch.org/docs/stable/nn.html] PyT...
Mr_Michael阅读 3,321评论 0赞 1

赞1赞

赞赏

手机看全文