Pytorch学习笔记(3) Neural NetWork

神经网络可以通过torch.nn包构建。

之前已经对torch.autograd包和Tensor包有个基本的认识。

通过torch.nn 模型来构建升级网络模型。
torch.nn包依赖于torch.autograd 来构建神经网络模型并实现反向传播（梯度计算）。
nn.Module包含了神经网络各层的定义，通过foward(input)方法返回输出output。

Example

以下是一个对数字图像进行分类的神经网络结构（LeNet5）:

LeNet5网络结构

这是一个简单的前馈神经网络。结构一张32*32的图片作为输入，通过几个不同的网络层，最后得到输出。

经典的神经网络训练过程如下：

定义含有待学习参数（权重）的神经网络结构
数据集输入
处理输入数据，通过前向传播获得输出
计算损失值
更新网络的权重，最简单的更新规则：
weight = weight - learning_rate * gradient

定义神经网络

使用Pytorch来定义上图中的网络结构：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.autograd import Variable

class LeNet(nn.Module):
    
    def __init__(self):
        super(LeNet,self).__init__()
#         self.conv1 = nn.Conv2d(1,6,5) #
#         self.mp = nn.max_pool2d(2,2)
#         self.conv2 = nn.Conv2d()
        
        self.conv1 = nn.Sequential(
            nn.Conv2d(1,6,5),
            nn.ReLU(),
            nn.MaxPool2d((2,2))
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(6,16,5),
            nn.ReLU(),
            nn.MaxPool2d((2,2))
        )
        self.fc1 = nn.Linear(16*5*5,120)
        self.fc2 = nn.Linear(120,84)
        self.fc3 = nn.Linear(84,10)
        
    
    def forward(self,input): # (B，1，32，32)
        print(input)
#         卷积=》池化
        x = self.conv1(input)
        x = self.conv2(x)
#         全连接
#         x = x.view(input.size()[0],-1)
        x = x.view(-1,self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)

        return x
    
    def num_flat_features(self, x):
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features   

net = LeNet()
print(net)

Output

模型的参数

我们只需要去定义前向传播(forward function)模型, 反向传播(backward)的过程在我们调用autograd的时候，自动生成。
你可以在forward的过程中使用任何Tensor操作。
通过 net.parameters()获得神经网络模型的所有参数

params = list(net.parameters())
print(len(params))
print(params[0].size())  # conv1's .weight

# 计算模型的参数总量
all_params = sum(p.numel() for p in net.parameters())
print(all_params)

结果

（6，1，5，5）和我们在模型中定义的结构相同
forward函数的输入与输出都是autograd.Variable类型的.

随记生成一个期望输入 32*32。测试模型的输出。

input = torch.randn(1, 1, 32, 32)
out = net(input)
print(out)

#  输出
tensor([[ 0.0158, -0.0394,  0.1107,  0.1668,  0.1236,  0.0622, -0.0679,  0.0233,
          0.0937, -0.1895]], grad_fn=<AddmmBackward>)
输出了十个评分值，和我们的预期输出相同

所有参数的梯度清零，并且以随记初始值进行反向传播

net.zero_grad()
out.backward(torch.randn(1, 10))

注意点

torch.nn包仅支持对批量数据的处理,而不能对单个样本进行处理。当你需要对单个数据进行处理的时候，使用input.unsqueeze(0)来增加假的batch维度。
nn.Conv2()的输出为 (Batch, Channels, Height,Weight)

损失函数(Loss Function)

output = net(input)
target = torch.randn(1,10)  # a dummy target, for example
criterion = nn.MSELoss() # 均方误差

loss = criterion(output, target)
print(loss)

# 输出
tensor(0.3994, grad_fn=<MseLossBackward>)

沿着loss的反向传播方向，依次用.grad_fn属性，就可以得到如下所示的计算图．

input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d
      -> view -> linear -> relu -> linear -> relu -> linear
      -> MSELoss
      -> loss

所以当我们调用loss.backward()函数的时候，整张图都被一次计算误差，所有Variable的.grad属性会被累加．

print(loss.grad_fn)  # MSELoss
print(loss.grad_fn.next_functions[0][0])  # Linear
print(loss.grad_fn.next_functions[0][0].next_functions[0][0])  # ReLU

#输出
<MseLossBackward object at 0x1289a0e90>
<AddmmBackward object at 0x1289a0850>
<AccumulateGrad object at 0x1289a0e90>

反向传播(Backprop)

我们只需要通过loss.backward 来实现反向传播的过程
由于变量的梯度是累加的，所以在求backward之前应该先使用 net.zero_grad() 或者 optimizer.zero_grad()对现有的梯度清零

net.zero_grad()     # zeroes the gradient buffers of all parameters

print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)

loss.backward()

print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

# 输出
conv1.bias.grad before backward
tensor([0., 0., 0., 0., 0., 0.])
conv1.bias.grad after backward
tensor([-0.0182,  0.0073, -0.0004,  0.0235, -0.0043,  0.0060])

现在我们知道如何去使用损失函数，更多损失函数的信息可以前往：Pytorch文档 Loss Function

更新模型参数(权重)

最简单的参数更新方法(SGD):

lr = 0.0001
for  f  in net.parameters():
    f.data.sub_(f.grad.data*lr)

为了满足不同的更新规则，比如 SGD, Nesterov-SGD, Adam, RMSProp等pttorch提供了一个很小的包：torch.optim

import torch.optim as optim

# create your optimizer
optimizer = optim.SGD(net.parameters(), lr=0.01)

# in your training loop:
optimizer.zero_grad()   # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()    # Does the update

参考资料

1、Pytorch Loss Function
2、Pytorch 优化器
3、Pytorch torch.nn模块

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 214,504评论 6赞 496
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,434评论 3赞 389
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 160,089评论 0赞 349
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,378评论 1赞 288
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,472评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,506评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,519评论 3赞 413
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,292评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,738评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,022评论 2赞 329
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,194评论 1赞 342
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,873评论 5赞 338
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,536评论 3赞 322
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,162评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,413评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,075评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,080评论 2赞 352