昨天差分的结果惨不忍睹。。。
可能transformer这个模型不需要差分?
不过差分后的结果和数据归一化之后的结果很像
不知他俩是不是内含某种联系
今天开始调学习率和层数 希望能在今晚之前得到一个不错的结果吧
今天要带助教课,特意起来化个妆妆~
keras.layers.GlobalAveragePooling1D()
按列进行平均池化,我在对比这样的池化层和直接给他铺平哪个效果更好一些
昨天差分的结果惨不忍睹。。。
可能transformer这个模型不需要差分?
不过差分后的结果和数据归一化之后的结果很像
不知他俩是不是内含某种联系
今天开始调学习率和层数 希望能在今晚之前得到一个不错的结果吧
今天要带助教课,特意起来化个妆妆~
按列进行平均池化,我在对比这样的池化层和直接给他铺平哪个效果更好一些