逻辑回归常见面试总结 一、基本知识 简要介绍:逻辑回归假设数据服从伯努利分布,通过极大似然函数的估计方法,运用梯度下降的方法来求解参数,来达到将...
VS Code之Python环境配置 一、配置本地的python环境 1、安装Anaconda3 在Anaconda官网下载最新版的Anacon...
Contextual Word Representations and Pretraining 一、Word Representations 在...
Subword Models 一、Morphology: Parts of words 在传统上,我们通常将语素作为最小的语义单位。在深度学习中...
ConvNets for NLP 一、From RNNs to Convolutional Neural Nets RNN无法捕获没有前缀上下文...
QA 一般来说,问答系统的目的就是根据给定的问题给出相应的答案。我们可以将其分解为两个步骤:1、查找(可能)包含答案的文档;2、在段落或文档中找...
机器翻译与seq2seq 一、早期的机器翻译 机器翻译(MT)是将句子x从一种语言(源语言)翻译成另一种语言(目标语言)的句子y的任务。机器翻译...
RNN中的梯度消失问题 一、RNN中的梯度消失 1、梯度消失的影响 梯度消失是神经网络中比较常见也是比较严重的一个问题,在RNN中它会导致长距离...
语言模型和循环神经网络 一、语言模型 1、简介 简单来讲,语言模型就是通过对预测接下来会出现什么词这个任务建模得到的一个模型。下图就是一个简单的...