深度卷积神经网络(AlexNet) LeNet: 在大的真实数据集上的表现并不尽如⼈意。 1.神经网络计算复杂。 2.还没有⼤量深⼊研究参数初始化和⾮凸优化算法等诸多领域。 ...
LeNet 主要内容包括: lenet 模型介绍 lenet 网络搭建 运用lenet进行图像识别-fashion-mnist数据集 具体内容(附代码)链接:https://...
卷积神经网络基础 本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。 具体内容(附代码)链接:https://www.ke...
梯度消失、梯度爆炸以及Kaggle房价预测 主要内容包括: 1.梯度消失和梯度爆炸 2.考虑到环境因素的其他问题 3.Kaggle房价预测 具体内容(附代码)链接:https...
Transformer 在之前的章节中,我们已经介绍了主流的神经网络架构如卷积神经网络(CNNs)和循环神经网络(RNNs)。让我们进行一些回顾: CNNs 易于并行化,却不...
注意力机制 在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量(context vector)来获取输⼊序列信息。当编码器为循环神经⽹络时,背...
机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 具体内容(附代码)链接:https://www.kesci...
过拟合、欠拟合及其解决方案 主要内容包括: 1.过拟合、欠拟合的概念 2.权重衰减 3.丢弃法 具体内容(附代码)链接:https://www.kesci.com/org/b...
GRU 具体内容(附代码)链接:https://www.kesci.com/org/boyuai/project/5e4291f05f2816002ce8f9a0 代码讲解视...
循环神经网络 具体内容(附代码)链接:https://www.kesci.com/org/boyuai/project/5e42c3ad5f2816002ce979b0 代码...
语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为T的词的序列w1,w2,…,wT,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: P(w1,w...
文本预处理 主要内容包括: 1.读入文本 2.分词 3.建立字典,将每个词映射到一个唯一的索引(index) 4.将文本从词的序列转换为索引的序列,方便输入模型 具体内容(附...
多层感知机 主要内容包括: 1.多层感知机的基本知识 2.使用多层感知机图像分类的从零开始的实现 3.使用pytorch的简洁实现 具体内容(附代码)链接:https://w...
softmax和分类模型 主要内容包括: 1.softmax回归的基本概念 2.如何获取Fashion-MNIST数据集和读取数据 3.softmax回归模型的从零开始实现,...
线性回归 主要内容包括: 1.线性回归的基本要素 2.线性回归模型从零开始的实现 3.线性回归模型使用pytorch的简洁实现 具体内容(附代码)链接:https://www...