换新工作后接手的第一个项目奇坑无比,外部不配合、系统问题多、业务合作方不给力……在这样一个背景下可想而知项目有多烂。偏偏我接手之后还是按照正常节奏去推进,导致拖了三四个月还没...
换新工作后接手的第一个项目奇坑无比,外部不配合、系统问题多、业务合作方不给力……在这样一个背景下可想而知项目有多烂。偏偏我接手之后还是按照正常节奏去推进,导致拖了三四个月还没...
任何人的成长都不是一瞬间完成的,大家都是一步步走过来的,比的是持续性和稳定性。所以,请对自己耐心一点,再耐心一点。 现在在做一个APP项目,相当于从之前的PC端B端产品经理转...
我今天顺利通过转正答辩啦!进入新公司三个月的时间让我想明白了一些事情。 1.环境非常影响人,如果一直在一个熟悉的环境中,会限制自己的认知边界。 举一个简单的例子:PPT工具的...
意图识别:分类问题 槽值检测:序列标注任务 目的:将用户的输入转换成结构化数据 对话管理,对话状态追踪:记住之前的信息,并追踪新的槽值,直到足够充分 可依据规则实现,如if、...
日前有同事离职,他身上的任务就交到我的手里。 任务是一个web端数据统计查看系统的改版,同事走之前已经设计完成,后面由我接手。本来以为按照PRD一步步开发就可以了,谁知遇到了...
从BERT到XLNet——李文哲 论文作者是以解决问题的思路展开研究的 广义自回归 目录: 1、无监督预训练 2、自回归&bert的目标函数:DAE,去噪自编码 迁移学习: ...
Bank在前两句是银行,后两行是河床(river bank) ELMo:用长文本训练词向量,而不是窗口;使用了CNN建立词的表达 一个词给出三个Embedding,不是固定的...
没有免费的午餐定律:没有任何算法能在任何情况下都是最佳 注意力机制&神经机器翻译(袁源) ELMo:上下文相关的词向量方式,基于BILSTM的 不用RNN可不可以做NLP,除...
Transformer(变形金刚)的一个重要应用是bert Transformer是一种seq2seq模型,它的特殊之处是大量地用了self-attention layer ...
本节先讨论怎样计算偏导数来实现logistic回归中单个样本实例的一次梯度下降法。本节使用导数流程图来计算logistic回归中的梯度下降。 计算logistic回归要做的是...
已经学习了很多深度学习和序列模型的知识,现在可以简单地描绘出一个触发字系统。随着语音识别的发展,越来越多的设备可以通过你的声音来唤醒,即触发字检测系统。那么如何建立一个触发字...
上节已经了解注意力模型如何让一个神经网络只注意到一部分的输入句子,当它在生成句子的时候,更像人类翻译。 下面详细讲解注意力模型 假定有一个输入句子,使用双向RNN或双向的GR...
现在,最令人振奋的发展之一就是seq2seq模型,在语音识别方面的准确性有了很大的提升。下面讲seq2seq模型是如何应用于音频数据的,比如语音。什么是语音识别问题呢?如有一...
可以说,一个神经网络的计算都是按照前向或反向传播过程来实现的。首先用初始参数计算出神经网络的输出,紧接着进行一个反向传播操作,用来计算出对应的梯度或者导数,用于更新参数。 ...
导数基本等同于斜率。即将x向右移动一点点之后(比如0.001),y值变化了多少,用y的变化值除以x的变化值就是斜率。 导数的定义:将a右移非常小的值,一个不可度量的非常非常小...
如何使用梯度下降法来训练和学习训练集上的参数w和b。 成本函数是损失函数关于每一个样本的平均值,衡量了参数w和b在训练集上的效果。要找到w和b使得成本函数最小。 如下...
为了训练logistic回归模型的参数w及b,需要定义一个成本函数,即用logistic回归训练的成本函数。 为了让模型来通过学习调整参数,要给一个m个样本的训练集。而是对一...
这是一个学习算法,用在监督学习问题中。若输出y标签是0或1时,这是一个二元分类问题。已知的输入特征向量x可能是一张图,希望它识别出这里有没有猫。你需要一个算法,可以给出一个预...
logistic回归是一个用于二分分类的算法。 例子:假如你有一张图片作为输入,想要输出识别此图的标签,是猫则为1,不是则为0。用y来表示输出的结果标签。 图片在计算机中是如...