神经网络中关于各层参数的分析

神经网络中不管是卷积层还是线性层的参数都是一个高维的矩阵向量，包括weight和bias，之前的时候一直关注的是数据和填入的参数大小，本文来分析一下每个层参数的shape以及如何自定义初始化各层的参数

1. 各层参数的 shape

1）线性层参数shape

import torch

# 线性层的权重weight是一个二维矩阵（输出特征数*输入特征数）
# 线性层的权重bias是一个一维向量 size = 输出特征的长度

fc1 = torch.nn.Linear(10, 512)
print("fc1.weight.data.size() = ", fc1.weight.data.size())

# 输出：
fc1.weight.data.size() =  torch.Size([512, 10])
fc1.bias.data.size() =  torch.Size([512])

2）卷积层参数shape
当我们定义好卷积核的尺寸之后，神经网络就自动帮我们进行卷积运算，但是实际上我们是不知道在实际卷积运算当中，卷积核的个数和每个卷积核的通道数量。

# 卷积核通道数 = 卷积输入数据的通道数
# 卷积核的个数 = 卷积层输出的通道数

import torch

# 2d卷积层的权重weight是一个四维的向量（输出通道数*输入通道数*卷积核size_1*卷积核size_2）
# 2d卷积层的权重bias是一个一维的向量 size = 输出通道数

conv1 = torch.nn.Conv2d(in_channels=1, out_channels=8, kernel_size=(3, 16))
print("conv1.weight.data.size() = ", conv1.weight.data.size())
print("conv1.bias.data.size() = ", conv1.bias.data.size())

# 输出
conv1.weight.data.size() =  torch.Size([8, 1, 3, 16])
conv1.bias.data.size() =  torch.Size([8])

3）BN层参数shape

import torch

# BN层的权重weight是一个一维向量 size = num_features
# BN层的权重bias是一个一维向量 size = num_features

bn1 = torch.nn.BatchNorm2d(64)
print("bn1.weight.data.size() = ", bn1.weight.data.size())
print("bn1.bias.data.size() = ", bn1.bias.data.size())

# 输出
bn1.weight.data.size() =  torch.Size([64])
bn1.bias.data.size() =  torch.Size([64])

4）池化层和Relu层是没有参数的

2. 打印整个神经网络各层的参数量


import torch
import torch.nn as nn
# 使用的是torchsummary提供的summary方法
from torchsummary import summary

# 定义的神经网络
class Module(nn.Module):
    def __init__(self):
        super(Module, self).__init__()
        
        self.conv1 = nn.Conv2d(3, 10, kernel_size=3, padding=1, bias=False)
        self.bn = nn.BatchNorm2d(10)
        self.maxPooling = nn.MaxPool2d(2)
        self.fc = nn.Linear(640, 10)
        self.relu = nn.ReLU(inplace=True)

    def forward(self, x):
        x = self.conv1(x)
        x = self.maxPooling(x)
        x = self.bn(x)
        x = self.relu(x)

        # Flatten data from (64, 10, 8, 8) to (64,640)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

if __name__ == '__main__':
    model = Module()
    summary(model, input_size=(3, 16, 16), batch_size=-1)

输出结果：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1           [-1, 10, 16, 16]             270
         MaxPool2d-2             [-1, 10, 8, 8]               0
       BatchNorm2d-3             [-1, 10, 8, 8]              20
              ReLU-4             [-1, 10, 8, 8]               0
            Linear-5                   [-1, 10]           6,410
================================================================
Total params: 6,700
Trainable params: 6,700
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.03
Params size (MB): 0.03
Estimated Total Size (MB): 0.06
----------------------------------------------------------------

3. 自定义神经网络每层的参数

了解了每层的参数量和参数shape，就可以自己指定神经网络的参数值

class Module(nn.Module):
    def __init__(self):
        super(Module, self).__init__()
        
        self.conv1 = nn.Conv2d(3, 10, kernel_size=3, padding=1, bias=False)
        self.bn = nn.BatchNorm2d(10)
        self.maxPooling = nn.MaxPool2d(2)
        self.fc = nn.Linear(640, 10)
        self.relu = nn.ReLU(inplace=True)
        # 调用参数初始化方法指定参数值
        self._model_param_init()

    def forward(self, x):
        x = self.conv1(x)
        x = self.maxPooling(x)
        x = self.bn(x)
        x = self.relu(x)

        # Flatten data from (64, 10, 8, 8) to (64,640)
        x = x.view(x.size(0), -1)

        x = self.fc(x)
        return x

    def _model_param_init(self):
        self.conv1.weight.data = torch.arange(270).reshape(10, 3, 3, 3)
        # self.conv1.bias.data = torch.arrange(270).reshape(10, 3, 3, 3)
        self.bn.weight.data = torch.arange(10)
        self.bn.bias.data = torch.arange(10)

        self.fc.weight.data = torch.arange(6400).reshape(10, 640)
        self.fc.bias.data = torch.arange(10)

if __name__ == '__main__':
    model = Module()
    for name, parameters in model.named_parameters():
        print(name, ':', parameters)
        print("\n")

输出结果：

conv1.weight : Parameter containing:
tensor([[[[  0,   1,   2],
          [  3,   4,   5],
          [  6,   7,   8]],

         [[  9,  10,  11],
          [ 12,  13,  14],
          [ 15,  16,  17]],

         [[ 18,  19,  20],
          [ 21,  22,  23],
          [ 24,  25,  26]]],


        [[[ 27,  28,  29],
          [ 30,  31,  32],
          [ 33,  34,  35]],

         [[ 36,  37,  38],
          [ 39,  40,  41],
          [ 42,  43,  44]],

         [[ 45,  46,  47],
          [ 48,  49,  50],
          [ 51,  52,  53]]],


        [[[ 54,  55,  56],
          [ 57,  58,  59],
          [ 60,  61,  62]],

         [[ 63,  64,  65],
          [ 66,  67,  68],
          [ 69,  70,  71]],

         [[ 72,  73,  74],
          [ 75,  76,  77],
          [ 78,  79,  80]]],


        [[[ 81,  82,  83],
          [ 84,  85,  86],
          [ 87,  88,  89]],

         [[ 90,  91,  92],
          [ 93,  94,  95],
          [ 96,  97,  98]],

         [[ 99, 100, 101],
          [102, 103, 104],
          [105, 106, 107]]],


        [[[108, 109, 110],
          [111, 112, 113],
          [114, 115, 116]],

         [[117, 118, 119],
          [120, 121, 122],
          [123, 124, 125]],

         [[126, 127, 128],
          [129, 130, 131],
          [132, 133, 134]]],


        [[[135, 136, 137],
          [138, 139, 140],
          [141, 142, 143]],

         [[144, 145, 146],
          [147, 148, 149],
          [150, 151, 152]],

         [[153, 154, 155],
          [156, 157, 158],
          [159, 160, 161]]],


        [[[162, 163, 164],
          [165, 166, 167],
          [168, 169, 170]],

         [[171, 172, 173],
          [174, 175, 176],
          [177, 178, 179]],

         [[180, 181, 182],
          [183, 184, 185],
          [186, 187, 188]]],


        [[[189, 190, 191],
          [192, 193, 194],
          [195, 196, 197]],

         [[198, 199, 200],
          [201, 202, 203],
          [204, 205, 206]],

         [[207, 208, 209],
          [210, 211, 212],
          [213, 214, 215]]],


        [[[216, 217, 218],
          [219, 220, 221],
          [222, 223, 224]],

         [[225, 226, 227],
          [228, 229, 230],
          [231, 232, 233]],

         [[234, 235, 236],
          [237, 238, 239],
          [240, 241, 242]]],


        [[[243, 244, 245],
          [246, 247, 248],
          [249, 250, 251]],

         [[252, 253, 254],
          [255, 256, 257],
          [258, 259, 260]],

         [[261, 262, 263],
          [264, 265, 266],
          [267, 268, 269]]]], requires_grad=True)


bn.weight : Parameter containing:
tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], requires_grad=True)


bn.bias : Parameter containing:
tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], requires_grad=True)


fc.weight : Parameter containing:
tensor([[   0,    1,    2,  ...,  637,  638,  639],
        [ 640,  641,  642,  ..., 1277, 1278, 1279],
        [1280, 1281, 1282,  ..., 1917, 1918, 1919],
        ...,
        [4480, 4481, 4482,  ..., 5117, 5118, 5119],
        [5120, 5121, 5122,  ..., 5757, 5758, 5759],
        [5760, 5761, 5762,  ..., 6397, 6398, 6399]], requires_grad=True)


fc.bias : Parameter containing:
tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], requires_grad=True)

最后编辑于：2023.02.23 16:46:17

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 215,294评论 6赞 497
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,780评论 3赞 391
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 161,001评论 0赞 351
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,593评论 1赞 289
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,687评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,679评论 1赞 294
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,667评论 3赞 415
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,426评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,872评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,180评论 2赞 331
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,346评论 1赞 345
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,019评论 5赞 340
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,658评论 3赞 323
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,268评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,495评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,275评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,207评论 2赞 352

神经网络中关于各层参数的分析

1. 各层参数的 shape

2. 打印整个神经网络各层的参数量

3. 自定义神经网络每层的参数

推荐阅读更多精彩内容