Introduction to Deep Learning

image.png

1、这是一个两层的神经网络,也可以叫做的模型;
2、这里面包含四个输入𝑥_(1 ),𝑥_2,𝑥_3,𝑥_4,对应于英文的nlp模型可以理解为每个单词或词组;
3、Hidden unit层的圆圈代表感知机,一个感知机相当于大脑的一个神经细胞;
4、最后的输出y,对应于分类的模型就是分类的类别。

训练过程中

输入的单词𝑥在进入感知机后,如果输出预测类别𝑦和真实的类别𝑦有差距,模型会对感知机内部的参数进行调整,使得预测的𝑦和真实值𝑦不断接近。 因为模型每次调整不会一部到位,而是调整小量的值(预防调整过头)。所以我们需要一定量带有真实类别y数据和时间来训练模型。 现实生活中进行的分类一般不只一类,一句话也不只4个单词。对应这样的工程就需要大量的数据集来训练模型。

要达到高性能水平,必须考虑两件事:

1、能够训练足够大的神经网络 ;
2、大量标记数据。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容