解决RuntimeError: CUDA error: invalid device symbol问题(已解决)

最近在跑一个程序,一直报RuntimeError: CUDA error: invalid device symbol错误,错误如下:

报错内容

我使用的环境是Python3.7,torch1.4.0,cuda10.2

版本情况

我确信程序肯定没有问题,就是环境的事情,google了所有的解决方法,全部都不行,崩溃。但是我肯定是cuda版本不合适,于是我用开启了更换cuda版本的漫长之路。我试图将cuda10.2版本更换成10.1,经过了各种各样的安装方法,各种修改/.bashrc还是失败,nvcc -V显示的一直是10.2版本。在我打算重新在GPU上重新开个账号,一切全新的重新开始之前,我做了最后的挣扎尝试,没想到竟然成了。

cuda版本

我查看当前torch1.4.0所需要的cuda版本是10.1

所需要的cuda版本

我直接重装一下带有cuda的torch呢,然后执行了以下命令

···

pip install torch===1.4.0+cu100 torchvision===0.5.0+cu100 -f https://download.pytorch.org/whl/torch_stable.html

···

安装完后,我又用nvcc -V查看了一下cuda版本,结果还是10.2,但是我重新运行了程序,完成Cuda error的错误已经解决了。

这个问题困扰了我整整三天,简直崩溃,写下来希望能帮助到其他人,能帮助到一个人就表示我没白写,哈哈哈。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容