最近我在github上下载了别人的深度学习算法,但是在我的tf2环境中出现了如上错误。
- 我的环境:
python3.6 + tensorflow 2.3.0 + keras 2.4.3
实际中采用了tensorflow.keras,不需要额外安装keras
- 结论:
我尝试了下面两种方法,均可以解决:
- 倒回版本
- 使x与y数据类型一致
Ⅰ 倒回版本
新环境:
python3.6 + tensorflow 1.15.0 + keras 2.4.0
该环境下能够正常运行,但是与我CUDA版本(10.1)不匹配
Ⅱ 使x与y数据类型一致
问题分析
训练集中,x是待分割图,经过归一化后为0到1的浮点数;y是掩膜,由0和1两个元素组成的分割结果
x与y的结构如下:
<HDF5 dataset "images": shape (2782, 512, 512, 1), type "<f8">
<HDF5 dataset "masks": shape (2782, 512, 512, 1), type "<i4">
因此我们要做的就是把y也变成浮点数数组
改变数据类型
将整形数组改为浮点型数组,可使用如下代码:
livers = np.array(livers, dtype='float32')
对与我的情况,主要是修改HDF5DatasetWriter.py
中的写入代码
self.data = self.db.create_dataset("images", image_dims, dtype="float")
self.masks = self.db.create_dataset("masks", mask_dims, dtype="float")
缺少 cupti64_80.dll
我采用了这个解决方法
cuDNN 相关
进行到这一步时,cuDNN仍然会报错。我采用了这个方法,在代码中加入:
gpus = tf.config.experimental.list_physical_devices('GPU')
for gpu in gpus:
tf.config.experimental.set_memory_growth(gpu, True)
终于可以运行了。如果还出错的话可以试下调小batch_size。