pytorch 随机种子设置以及模型比对

目的

我们为了重现模型,希望随机的部分再次重现的时候,能够得到相同的值。有时候为了模型比对也需要如此。

设置


import torch
import numpy as np
import random


def set_seed(seed: int = 7) -> None:
    """
    设置相关函数的随机数种子
    :param seed: 随机数种子
    :return: None
    """

    # 随机数种子设定
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)

    # CUDA中的一些运算,如对sparse的CUDA张量与dense的CUDA张量调用torch.bmm(),它通常使用不确定性算法。
    # 为了避免这种情况,就要将这个flag设置为True,让它使用确定的实现。
    torch.backends.cudnn.deterministic = True

    # 设置这个flag可以让内置的cuDNN的auto-tuner自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。
    # 但是由于噪声和不同的硬件条件,即使是同一台机器,benchmark都可能会选择不同的算法。为了消除这个随机性,设置为 False
    torch.backends.cudnn.benchmark = False

set_seed()

s = torch.tensor([1, 2, 3])
g = torch.zeros((2, 1))
print("g", g)
print("g normal", g.normal_(0.0, 1.0))

set_seed()

w = torch.zeros((2, 1))
print("w", w)
print("w normal", w.normal_(0.0, 1.0))


这样输出的 g 和 w 是一样的。


# 模型比对
即使设置的种子,依然在比对复杂模型的时候有一定难度。原因在,模型可能有些差异,那么这时候,可以考虑使用 fake_weight,两个模型都使用同样的随机值初始化权重。使用 apply 函数将其权重都使用相同的随机值进行初始化。具体参考 easytext, `mrc/tests/models/test_mrc_ner.py`
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 深度学习网络模型中初始的权值参数通常都是初始化成随机数,而使用梯度下降法最终得到的局部最优解对于初始位置点的选择很...
    晓柒NLP与药物设计阅读 10,845评论 0 15
  • 全局种子 tf.random.set_seed(116) 针对程序重新运行或者tf.function(类似于re-...
    见喉阅读 804评论 0 0
  • 前言 从入职到现在一直在使用随机数,只知道在使用随机数时,需要先设置一下随机种子,但却不知道为什么要这么做,知其然...
    e196efe3d7df阅读 4,069评论 0 4
  • 随机性: 深度学习的一个项目,其中的随机性会非常的大,比如以下因素: 随机生成的模型参数,可能是随机选取的训练样本...
    三方斜阳阅读 609评论 0 0
  • seed( ) 用于指定随机数生成时所用算法开始的整数值。 1.如果使用相同的seed( )值,则每次生成的随即数...
    zhengda4dream阅读 5,372评论 0 0