伯禹学习打卡2 - 杂记


欠拟合 过拟合

训练误差 泛化误差

训练误差: 在训练数据集上表现出来的误差
泛化误差:在测试数据样本上表现出来的误差的期望
使用损失函数计算误差 , 关注降低泛化误差

模型选择
  • 验证数据集
  • K折交叉验证
欠拟合: 模型无法达到一个较低的训练误差

增加模型复杂度

过拟合:训练误差低,泛化误差高
增加数据集
权重衰减

L2范数正则化:模型权重参数平方和与一个正参数的乘积,通过惩罚绝对值较大的模型参数来增加限制,可能对过拟合有效.

def l2_penalty(w):
    return (w**2).sum() / 2

l = loss(net(X, w, b), y) + lambd * l2_penalty(w)
l = l.sum()
#使用 pytorch
optimizer_w = torch.optim.SGD(params=[net.weight], lr=lr, weight_decay=wd) # 对权重参数衰减
optimizer_b = torch.optim.SGD(params=[net.bias], lr=lr)  # 不对偏差参数衰减
dropout

以p概率随机丢弃某些元素 降低过拟合.训练时使用, 测试时不使用


梯度消失 梯度爆炸

激活函数的选择

在深层网络中尽量避免选择sigmoid和tanh激活函数,原因是这两个激活函数会把元素转换到[0, 1]和[-1, 1]之间,会加剧梯度消失的现象!

协变量偏移 标签偏移 概念偏移

协变量偏移: 一个在冬季部署的物品推荐系统在夏季的物品推荐列表中出现了圣诞礼物,可以理解为在夏季的物品推荐系统与冬季相比,时间或者说季节发生了变化,导致了夏季推荐圣诞礼物的不合理的现象,这个现象是由于协变量时间发生了变化造成的。
标签偏移: 标签偏移可以简单理解为测试时出现了训练时没有的标签
概念偏移: 可以根据其缓慢变化的特点缓解

如果数据量足够的情况下,确保训练数据集和测试集中的数据取自同一个数据集,可以防止协变量偏移和标签偏移是正确的。如果数据量很少,少到测试集中存在训练集中未包含的标签,就会发生标签偏移。


神经网络

使用torch.nn 包来构建神经网络.
一个神经网络的典型训练过程如下:

  • 定义包含一些可学习参数(或者叫权重)的神经网络
  • 在输入数据集上迭代
  • 通过网络处理输入
  • 计算损失(输出和正确答案的距离)
  • 将梯度反向传播给网络的参数
  • 更新网络的权重,一般使用一个简单的规则:weight = weight - learning_rate * gradient
定义网络
import torch
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):

  def __init__(self):
    super(Net,self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5) # 输入通道 1  输出通道 6  5*5 卷积核
    self.conv2 = nn.Conv2d(6, 16, 5)
    self.fc1 = nn.Linear(16 * 5 *5 ,120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

  def forward(self, x):
    x = F.max_pool2d(F.relu(self.conv1(x)),(2,2)) # 2 * 2 最大池化
    x = F.max_pool2d(F.relu(self.conv2(x)),2) # 方正,可以只使用一个数字
    x = x.view(-1,self.num_flat_features(x)) #flatten
    x = F.relu(self.fc1(x))
    x = F.relu(self.fc2(x))
    x = self.fc3(x)
    return x

  def num_flat_features(self, x):
    size = x.size()[1:] # 除去批处理的其他所有维度
    num_features = 1
    for s in size:
      num_features *= s
    return num_features


net = Net()
print(net)

我们只需要定义 forward 函数,backward函数会在使用autograd时自动定义,backward函数用来计算导数。

# 可学习参数通过net.parameters()返回
params = list(net.parameters())
print(len(params))
print(params[0].size())

input = torch.randn(1, 1, 32, 32)
out = net(input)
print(out) 

#清零所有参数的梯度缓存,然后进行随机梯度的反向传播:
net. zero_grad()
out.backward(torch.randn(1, 10)) 

损失函数

一个损失函数接受一对(output, target)作为输入,计算一个值来估计网络的输出和目标值相差多少。

output = net(input)
target = torch.randn(10) 
print(target.shape)
target = target.view(1, -1) 
print(target.shape)
criterion = nn.MSELoss() # 均方差

loss = criterion(output, target)
print(loss)
反向传播

我们只需要调用loss.backward()来反向传播权重。我们需要清零现有的梯度,否则梯度将会与已有的梯度累加。

net.zero_grad()

print('before backward')
print(net.conv1.bias.grad)

loss.backward()

print('after backward')
print(net.conv1.bias.grad)
更新权重

SGD 随机梯度下降法

weight = weight - learning_rate * gradient

learning_rate = 0.01
for i in net.parameters():
  f.data.sub_(f.grad.data * learning_rate)

torch.optim 封装了不同的更新规则

import torch.optim as optim

optimizer = optim.SGD(net.parameters(),lr = 0.01)

optimizer.zero_grad() 
output = net(input)
loss = criterion(out, target)
loss.backward()
optimizer.step() #更新
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容