1.环境配置
1.1 安装CUDA
https://developer.nvidia.com/zh-cn/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
从该网址选择适合你的版本,下载安装完成之后将路径添加至系统变量。
最新版(2021年4月)安装可参考此网站
https://blog.csdn.net/weixin_42101177/article/details/113512010
1.2 安装CUDNN
https://developer.nvidia.com/zh-cn/cudnn
从该网址下载CUDNN,需要Nvidia账户,没有的需要先注册。注意选择的CUDNN版本要与CUDA版本相对应。
1.3 安装Nvidia最新显卡驱动
自行去Nvidia官网根据自己的显卡型号搜索下载。
1.4 安装Anaconda
1.5 安装TensorFlow
直接使用pip命令安装,注意根据自己的实际需要选择cpu版本或者gpu版本。如果使用cpu版本就不需要上面的一些列操作。
1.6 在此过程中本人遇到的问题
- CUDA版本/CUDNN版本/TensorFlow版本一致性的问题,对新手不友好
- CUDA安装过程中的环境变量设置,比较麻烦,对于不理解背后原理很容易搞错
- Anaconda的命令操作,不熟悉,上手需要一定的基础
- GPU test不通过,提示找不到CUDA的一个dll文件,通过修改CUDA\bin文件夹下dll文件的名字解决,这可能是tensorflow对改版本的CUDA支持不及时造成
- Anaconda创建虚拟环境时不成功,应为Anaconda文件夹在当前用户下权限不够,给了权限之后可
2. 配置tensorflow相关工具资源
本教程参考github文章,注意,该教程真针对tensorflow v2.0以下版本有效,V2.0版本可直接通过pip安装tf-models,不需要自己编译、安装了。(可直接调到第三步)
https://github.com/EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10/blob/master/translate/README_Chinese.md
前面步骤一直没有问题,知道build和setup这一步出现问题。
问题原因如下:
tensor官方更改了setup.py文件的地址,cd到新的地址即可解决
解决上述问题之后,在install环节,终端报错如下
需要安装微软c++编译工具,微软比较流氓,直接进网页的话会让安装visual studio,可通过以下链接只下载安装c++ build tools。
http://go.microsoft.com/fwlink/?LinkId=691126
出现上面情况的根本原因在于,github教程中使用的tensorflow版本较老,同时与之配到的tf-models也比较老,我们按照教程使用tensorflow-1.13,并安装对应版本的tf-models就可以啦,具体参考后面
3. 安装与tensorflow-1.13匹配版本的CUDA、CUDNN,并在anaconda中新建tf-gpu-1.13环境
参考第一部分,中心安装CUDA、CUDNN,并在anaconda中新建tf-gpu-1.13环境,在该环境下重新按照github教程进行即可。
遇到的问题
- 运行
jupyter notebook object_detection_tutorial.ipynb
时没有直接跳转到脚本页面
需要手动选择object_detection_tutorial.ipynb脚本,即可,运行该代码段时,必须等左侧【*】中变为数字才算执行完成,然后再继续执行下一代码片段