Task 3 字符识别模型

这三天了解了一下CNN(这个打卡写的我想吐 完全是划水 从task2 到task3 跳度有点大)
对于这个task 我的目标就设为理解出现在pdf中的所有代码吧, i am so vegetable QAQ


代码片段1

nn.Sequential 是把一堆模型堆起来
nn.Conv2d(3, 16, kernel_size = (3, 3), stride = (2, 2)) 是一个CNN,输入通道数为3, 输出通道数为16,pdf里面写输入的图片的大小,按照baseline里面的图片大小来,就是(64 * 128) 感觉(2, 2)stride和图片大小不配套啊 听大神说pytorch会自动处理这个问题
ReLU 就是一个非线性函数 对Conv2d的输出进行处理
MaxPool2d 池化层
Sequential 完了以后 就用5个全连接 输出5个数字是0~10的概率

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。