图像增广 图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的...
在源数据集(如ImageNet数据集)上预训练一个神经网络模型,即源模型 创建一个新的神经网络模型,即目标模型。它复制了源模型上除了输出层外的所...
使用文本情感分类来分析文本作者的情绪 同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用 建模步骤 文本情感分类数据 ——读取数据 ——预...
全局向量的词嵌入(GloVe) GloVe模型采用了平方损失,并基于该损失对跳字模型做了3点改动 在有些情况下,交叉熵损失函数有劣势,GloVe...
把词映射为实数域向量的技术也叫词嵌入 跳字模型 假设基于某个词来生成它在文本序列周围的词 每个词被表示成两个 d维向量,用来计算条件概率 训练中...
机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT) 主要特征:输出是单词序列而不是...
动量法 设时间步t的自变量为xt,学习率为ηt。在时间步0,动量法创建速度变量v0,并将其元素初始化成0。在时间步t>0,动量法对每次迭代的步骤...
使用适当的学习率,沿着梯度反方向更新自变量可能降低目标函数值,梯度下降重复这一更新过程直到得到满足要求的解 学习率过大或过小都有问题,一个合适的...
尽管优化方法可以最小化深度学习中的损失函数值,但本质上优化方法达到的目标与深度学习的目标并不相同 优化方法目标:训练集损失函数值 深度学习目标:...