师兄意外的回来了,学弟已经不想帮我看代码了,所以师兄就过来找bug。
mlp和roi都放在cpu和都放在ipu,没有任何问题。
roi在ipu,mlp在cpu也没有问题。
roi在cpu,mlp在ipu,问题就大了。
索性mlp不要放在ipu上了。
师兄怀疑是cpu上多个batch reshape的问题。因为cpu和ipu数据摆放方式不一样,有可能,但是传进ipu的数传出来再打印,又没有问题了,很奇怪。
现在的scale是180,所里边儿scale是600的情况都能跑,而且好像不打算更新这个bug了,咋办?
跑测试集时,没有开stream,共用一个session,否则每张图都得读一次模型。500张,在364张的地方挂掉了,原因不明。
我给自己起了个外号,bug generator,呵呵。