主题
卷积神经网络(基础篇)
总结
相机成像:一个光敏电阻接受一个小的光锥,由光敏电阻阵列接受来自物理世界的光波。
卷积层的权重是4-D张量,第一个维度是输入数据的通道数
代码
只需要把对模型的定义换掉,其余不变
class Net(torch.nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)
self.conv2 = torch.nn.Conv2d(10, 20,kernel_size=5)
self.pooling = torch.nn.MaxPool2d(2)
self.fc = torch.nn.Linear(320, 10)
def forward(self, x):
batch_size = x.size(0)
x = F.relu(self.pooling(self.conv1(x)))
x = F.relu(self.pooling(self.conv2(x)))
x = x.view(batch_size, -1)
x = self.fc(x)
return x
[1, 300] Loss: 0.627
[1, 600] Loss: 0.195
[1, 900] Loss: 0.146
Accuracy on test set:96.88 %
[2, 300] Loss: 0.115
[2, 600] Loss: 0.103
[2, 900] Loss: 0.090
Accuracy on test set:97.64 %
[3, 300] Loss: 0.080
[3, 600] Loss: 0.074
[3, 900] Loss: 0.074
Accuracy on test set:97.98 %
[4, 300] Loss: 0.059
[4, 600] Loss: 0.064
[4, 900] Loss: 0.063
Accuracy on test set:98.52 %
[5, 300] Loss: 0.056
[5, 600] Loss: 0.050
[5, 900] Loss: 0.056
Accuracy on test set:98.50 %
[6, 300] Loss: 0.049
[6, 600] Loss: 0.051
[6, 900] Loss: 0.046
Accuracy on test set:98.59 %
[7, 300] Loss: 0.044
[7, 600] Loss: 0.043
[7, 900] Loss: 0.045
Accuracy on test set:98.55 %
[8, 300] Loss: 0.038
[8, 600] Loss: 0.040
[8, 900] Loss: 0.046
Accuracy on test set:98.79 %
[9, 300] Loss: 0.038
[9, 600] Loss: 0.036
[9, 900] Loss: 0.037
Accuracy on test set:98.71 %
[10, 300] Loss: 0.032
[10, 600] Loss: 0.034
[10, 900] Loss: 0.040
Accuracy on test set:98.83 %
定义模型:在
def __init__(self)
中不考虑batch_size的大小,在def forward
中考虑batch_size的大小。卷积层:
torch.nn.Conv2d(in_channels, out_channels, kernel_size=···)
:kernel_size传入一个数指的是正方形尺寸,也可以传入一个元组,即矩形算子尺寸。其他参数:padding=1,bias=Fasle/True,stride=2
。卷积层不必传入输入的长宽尺寸,因为它是遍历卷积MaxPooling层:
torch.nn.MaxPool2d(kernel_size=2)
通道数不变。因为该层没有参数,所以在定义模型时只需实例化一个,它可以被重复使用。Tensor.view()
会返回一个新的Tensor,不会修改原Tensor,可以理解为是一个计算图节点。这个节点在forward阶段建立,它的传入参数需要考虑batch_size,即返回的新Tensor的尺寸的第一个维数是batch_size。在forward(self, x)
中,首先写上batch_size = x.size(0)
以获取当前训练传入的样本个数,后续用于x.view(batch_size, -1)
。
用GPU加速
迁移到GPU上分为两步:
- 把模型迁移至GPU:把网络的参数与结构信息全部放入GPU,转换成CUDA Tensor
model = Net()
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model.to(device)
- 把数据(训练与测试)迁移至GPU:数据与模型要迁移在同一块GPU上
inputs, target = data
inputs, target = inputs.to(device), target.to(device)