Pytorch采坑记~~持续更新中......

1.nn.Conv2D()输入参数数据格式不对

报错:TypeError: new() received an invalid combination of arguments - got (float, int, int, int), but expected one of:
完整报错

  File "G:/python/project/model/A2net.py", line 36, in <module>
    model = A2Block(64)
  File "G:/python/project/model/A2net.py", line 15, in __init__
    self.dimension_reduction = nn.Conv2d(in_channels=inplanes, out_channels=inplanes/2, kernel_size=1, stride=1)
  File "C:\Users\MSY\Anaconda3\lib\site-packages\torch\nn\modules\conv.py", line 297, in __init__
    False, _pair(0), groups, bias)
  File "C:\Users\MSY\Anaconda3\lib\site-packages\torch\nn\modules\conv.py", line 33, in __init__
    out_channels, in_channels // groups, *kernel_size))
TypeError: new() received an invalid combination of arguments - got (float, int, int, int), but expected one of:
 * (torch.device device)
 * (torch.Storage storage)
 * (Tensor other)
 * (tuple of ints size, torch.device device)
 * (object data, torch.device device)

问题定位:定位到报错行为:

self.dimension_reduction = nn.Conv2d(in_channels=inplanes, out_channels=inplanes/2, kernel_size=1, stride=1)

问题分析: 根据报错信息,是说本行代码包含有float的数据类型,通过分析可以看到,只有inplanes/2可能是float类型,由此想到在python3中n/2是带有小数点的,应该为n//2为整数。(由于一个粗心,报错一个如此尴尬的bug)
问题解决:将输出通道数inplanes/2改为inplanes//2完美解决。


2.make.sh 编译NMS遇到问题

报错:OSError: The CUDA lib64 path could not be located in /usr/lib64
完整报错

Traceback (most recent call last):
  File "build.py", line 59, in <module>
    CUDA = locate_cuda()
  File "build.py", line 54, in locate_cuda
    raise EnvironmentError('The CUDA %s path could not be located in %s' % (k, v))
OSError: The CUDA lib64 path could not be located in /usr/lib64

问题定位:打开build.py(某些项目为setup.py)找到

cudaconfig = {'home': home, 'nvcc': nvcc,
                  'include': pjoin(home, 'include'),
                  'lib64': pjoin(home, 'lib64')}

问题分析:lib引用的问题
问题解决:将home, 'lib64'中的lib64改为lib完美解决


3.one of the variables needed for gradient computation has been modified by an inplace operation

报错:one of the variables needed for gradient computation has been modified by an inplace operation
完整报错

Traceback (most recent call last):
  File "train_test.py", line 454, in <module>
    train()
  File "train_test.py", line 327, in train
    loss.backward()
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/tensor.py", line 93, in backward
    torch.autograd.backward(self, gradient, retain_graph, create_graph)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/autograd/__init__.py", line 90, in backward
    allow_unreachable=True)  # allow_unreachable flag
RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation

问题定位:这个bug报错并没有报明显的错误位置是最难过的,wwwwww~~~~~
问题分析:此问题是在测试运行网上关于一版Pytorch版本的SSD代码时,出现的,根据网上的错误解释,应该时Pytorch0.4版本和0.3版本的某些不一致造成的。该问题的常用解决方法时:
1:如果使用的是pytorch0.4.0版本,回退到pytorch0.3.0版本
2:如果有inreplace参数,设为False
3:报错原因是pytorch0.4.0版本后tensor不支持inplace操作了,所以把所有inplace错作去掉。
后在博客modified by an inplace operation中似乎找到了合适的答案.简单来说:x += 1 这种改成 x = x+1 原因:x+=1的值会直接在原值上面做更新,是inplace=True的情况,而后一种是先让x+1然后赋值给x,属于inplace=False
但是由于自己的代码较多,开始很难具体定位到哪个错误的位置,后来使用Beyond Compare(一款很棒的软件,强推~~~)与网上一版正确的代码比较,发现了错误。

x /= norm  #(原本的错误代码)

In-place的具体解释可以参考。pytorch 学习笔记(二十二):关于 inplace operation
问题解决: 将x /= norm #改为x = x / norm
后记:后来偶然发现,Pycharm原来有全局搜索的功能,上述也说大致的问题由于 /= 操作符产生,但是代码过多,无法有效的找到 /=代码所在emmmmm,可以使用全局搜索Pycharm中按快捷键Ctrl + Shift + F或从从菜单Edit-》Find-》Find in Path进入全局查找界面,输入 /= 即可找到大致所在,VS code也可,自行查找即可。(白白浪费了那么多自己查找的时间,哇的一声~~~,对Pycharm还有待探索)

Pycharm全局搜索

补充:后来运行另外一个代码的时候,发现报了相同的错误,后来找到的错误为:

x.unsqueeze_(1) 改为:x = x.unsqueeze(1) 

4.Fan in and fan out can not be computed for tensor with less than 2 dimensions

报错: Fan in and fan out can not be computed for tensor with less than 2 dimensions
完整报错

 File "train_test_RFB.py", line 143, in <module>
    net.extras.apply(weights_init)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 240, in apply
    module.apply(fn)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 240, in apply
    module.apply(fn)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 241, in apply
    fn(self)
  File "train_test_RFB.py", line 134, in weights_init
    init.kaiming_normal_(m.state_dict()[key], mode='fan_out')
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/init.py", line 323, in kaiming_normal_
    fan = _calculate_correct_fan(tensor, mode)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/init.py", line 257, in _calculate_correct_fan
    fan_in, fan_out = _calculate_fan_in_and_fan_out(tensor)
  File "/home/miao/anaconda3/lib/python3.6/site-packages/torch/nn/init.py", line 181, in _calculate_fan_in_and_fan_out
 raise ValueError("Fan in and fan out can not be computed for tensor with less than 2 dimensions")
ValueError: Fan in and fan out can not be computed for tensor with less than 2 dimensions

问题定位:

init.kaiming_normal_(m.state_dict()[key], mode='fan_out')

问题分析:根据报错信息,可以知道,再使用init.kaiming_normal_()进行初始化的时候,只能初始化不小于2的维度的tensor,经过分析得到,在常见的使用

 if 'conv' in key:
                    init.kaiming_normal_(m.state_dict()[key], mode='fan_out')

进行初始化的过程中,问题出在定义的conv层,回想自己的网络,在conv中的定义

self.conv = nn.Sequential(nn.Conv2d(in_channels, inter_channels, 3, padding=1, bias=False),
                                   nn.BatchNorm2d(inter_channels),
                                   nn.ReLU())

其中包含了BatchNorm层,而在 BatchNorm layer维度1 , 小于2。'Fan in and fan out can not be computed for tensor with less than 2 dimensions'
问题解决: 将复合的conv拆开写,或者改写初始化


5.libpng error: Read Error

报错:opencv2 报错 libpng error: Read Error
完整报错

libpng error: Read Error
Traceback (most recent call last):
  File "main.py", line 100, in <module>
    main(config)
  File "main.py", line 43, in main
    train.train()
  File "/home/msy/project/PoolNet-master/solver.py", line 84, in train
    for i, data_batch in enumerate(self.train_loader):
  File "/home/msy/anaconda3/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 637, in __next__
    return self._process_next_batch(batch)
  File "/home/msy/anaconda3/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 658, in _process_next_batch
    raise batch.exc_type(batch.exc_msg)
AttributeError: Traceback (most recent call last):
  File "/home/msy/anaconda3/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 138, in _worker_loop
    samples = collate_fn([dataset[i] for i in batch_indices])
  File "/home/msy/anaconda3/lib/python3.6/site-packages/torch/utils/data/dataloader.py", line 138, in <listcomp>
    samples = collate_fn([dataset[i] for i in batch_indices])
 File "/home/msy/project/PoolNet-master/dataset/dataset.py", line 27, in __getitem__
    sal_image = load_image(os.path.join(self.sal_root, im_name))
  File "/home/msy/project/PoolNet-master/dataset/dataset.py", line 77, in load_image
    if len(im.shape) != 3 or im.shape[2] != 3:
AttributeError: 'NoneType' object has no attribute 'shape'

问题定位

im = cv2.imread(name)
len(im.shape) != 3 or im.shape[2] != 3:

问题分析:图片格式的问题,有些图片比如说原本是jpg的格式,你后缀写成了.png或者其他类似的操作,就可能会出现这个问题(还是不完全理解,欢迎补充解答)。
问题解决

import cv2
import numpy as np
from PIL import Image
from PIL import ImageFile
import imghdr

ImageFile.LOAD_TRUNCATED_IMAGES = True
if imghdr.what(name) == "png":
    Image.open(name).convert("RGB").save(name)
img = np.array(Image.open(name))

参考
https://blog.csdn.net/andylei777/article/details/78095411
http://www.itdaan.com/blog/2016/11/22/d480f443ca62e56ddc47a7bed7cc85fd.html


6.TypeError: cannot assign 'torch.cuda.FloatTensor' as parameter 'edges' (torch.nn.Parameter or None expected)

报错

TypeError: cannot assign 'torch.cuda.FloatTensor' as parameter 'edges' (torch.nn.Parameter or None expected)

问题定位

class Conv(nn.Module):
    def __init__(self, in_features, out_features, bias=False):
        super(Conv, self).__init__()  
  
        self.edges = Parameter(torch.Tensor(20, 20))
        self.sigmoid = nn.Sigmoid()
      
    def forward(self, input, adj):
        self.edges= self.sigmoid((self.edges))

报错分析:根据报错的原因是不能将torch.cuda.FloatTensor作为torch.nn.Parameter的结果类型,所以只能将torch.cuda.FloatTensor的结果赋值给torch.nn.Parameter变量的data属性。
问题解决

self.edges.data= self.sigmoid((self.edges))

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容