测试文件scratch_10
函数
输入维度[5,129,256]
经过一个全连接
[5,129,1024]
经过一个激活函数
relu
[5,129,1024]
去掉非负数值
再经过一个全连接
[5,129,256]

位置嵌入函数

在输出的维度上是没有变化的

先经过一个线性层
d_model=256
d_ff=1024

线性层次

第一层线性层

relu函数
线性层之后经过一个激活函数,去掉负数

再经过一个线性层转化回来
测试文件scratch_10
函数
输入维度[5,129,256]
经过一个全连接
[5,129,1024]
经过一个激活函数
relu
[5,129,1024]
去掉非负数值
再经过一个全连接
[5,129,256]
d_model=256
d_ff=1024
线性层之后经过一个激活函数,去掉负数