登录注册写文章

Conv2D卷积核形状详解

Conv2D卷积核形状详解

直接看例子

import torch.nn as nn

conv = nn.Conv2d(3, 64, kernel_size=3)
print(conv.weight.shape)  # [64, 3, 3, 3]

这4个数字分别是什么？

记忆方法：出入高宽

[64,  3,  3,  3]
 ↓    ↓   ↓   ↓
出   入  高  宽

出：输出通道数
入：输入通道数
高：卷积核高度
宽：卷积核宽度

生活化理解

把卷积操作想象成"照片滤镜工厂"：

nn.Conv2d(3, 64, 3)  # 一个滤镜工厂

工厂里有64个不同的滤镜
每个滤镜都能处理彩色照片（3通道RGB）
每个滤镜都是3×3大小

所以权重就是：64个滤镜，每个都是3×3×3的立体结构。

多个例子

# 黑白照片处理
Conv2d(1, 16, 5)  → [16, 1, 5, 5]

# 彩色照片处理  
Conv2d(3, 64, 3)  → [64, 3, 3, 3]

# 深层特征处理
Conv2d(64, 128, 1) → [128, 64, 1, 1]

看出规律了吗？第一个数字永远是输出通道数，第二个数字永远是输入通道数。

为什么要这样？

处理RGB图片时：

输入有3层（红绿蓝）
每个卷积核必须同时处理这3层
要输出64个特征，就需要64个卷积核
每个卷积核的形状：[输入层数, 高, 宽] = [3, 3, 3]
总权重形状：[卷积核个数, 输入层数, 高, 宽] = [64, 3, 3, 3]

验证公式

Conv2d(输入通道, 输出通道, 核大小)
权重形状 = [输出通道, 输入通道, 核高, 核宽]

验证：

Conv2d(3, 64, 3)     → [64, 3, 3, 3] ✓
Conv2d(1, 32, 5)     → [32, 1, 5, 5] ✓  
Conv2d(16, 8, (2,4)) → [8, 16, 2, 4] ✓

记住这一点

Conv2D的权重形状就是：[几个滤镜, 输入几层, 滤镜多高, 滤镜多宽]

用"出入高宽"四个字记忆，基本不会错。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

pytorch1.0中nn.Conv1d和nn.Conv2d详解
nn.Conv1d 学习pytorch用于文本分类的时候，用到了一维卷积，花了点时间了解其中的原理，看网上也没有详...
top_小酱油阅读 13,409评论 0赞 7
各种卷积网络（转）
原:万字长文带你看尽深度学习中的各种卷积网络卷积 VS 互关联深度学习中的卷积网络（单通道版，多通道版） 3D...
zelda2333阅读 3,751评论 0赞 1

【论文解读】CNN深度卷积神经网络-GoogLeNet
前言本文主要CNN系列论文解读——GoogLeNet简介、模型结构、网络结构的代码实现等。原文发表于语雀文档，排...
Sunflow007阅读 4,709评论 0赞 1
变形卷积核、可分离卷积？卷积神经网络中10大拍案叫绝的操作
姓名：周雪宁学号：1702110196 转载：https://mp.weixin.qq.com/s/4-9SHF...
周雪宁阅读 8,561评论 1赞 2
通道洗牌、变形卷积核、可分离卷积？盘点卷积神经网络中十大令人拍案叫绝的操作。
CNN从2012年的AlexNet发展至今，科学家们发明出各种各样的CNN模型，一个比一个深，一个比一个准确，一个...
人工智豪阅读 12,422评论 5赞 53

赞1赞

赞赏

手机看全文