nvidia-smi是常用的GPU命令,那他们输出代表什么意思呢?今天就来做一个解读。
图1: nvidia-smi 输出
在这里,总结下常见问题:
问题:nvidia-smi显示CUDA Version:11.4, 系统安装的是11.1,这有没有问题?
回答:nvidia-smi显示的CUDA Version是当前驱动的最高支持版本,因为CUDA是向下兼容的,所以最高支持版本以下的CUDA版本都是支持的,以图1为例,nvidia-smi显示最高版本支持为11.4,那11.4以及11.4一下的版本都是支持的。
问题:我没有跑程序,为啥显存还是被占用?
回答:这种情况有可能是当前用户上次跑程序没有正常退出而导致显存没有释放,用户可手动释放,以图1为例,用户可以看到当前PID为65260的进程,占用了9883M显存,用户可以手动执行sudo kill -9 65260,释放显存。