2020-02-14

1.线性回归的基本要素

优化函数步骤:(1)初始化模型参数,一般来说使用随机初始化;(2)我们在数据上迭代多次,通过在负梯度方向移动参数来更新每个参数。

2.线性回归模型从零开始的实现

3.softmax回归是一个单层神经网络

4.O=(XWh+bh)Wo+bo=XWhWo+bhWo+bo.     输出层权重参数为WhWoWhWo,偏差参数为bhWo+bo

5.文本预处理通常包括四个步骤:

读入文本;分词;建立字典,将每个词映射到一个唯一的索引(index);将文本从词的序列转换为索引的序列,方便输入模型

6.分词存在的缺点:(1)标点符号通常可以提供语义信息,但是我们的方法直接将其丢弃了

                                (2)类似“shouldn't", "doesn't"这样的词会被错误地处理

                                (3)类似"Mr.", "Dr."这样的词会被错误地处理

7.一段含有4个词的文本序列的概率    P(w1,w2,w3,w4)=P(w1)P(w2∣w1)P(w3∣w1,w2)P(w4∣w1,w2,w3).

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包...
    周文韬阅读 245评论 0 0
  • 语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为TT的词的序列w1,w2,…,wTw1,w2,...
    丁怡泽sns阅读 207评论 0 0
  • 学习笔记 一、文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,对文本处理主要包含以下步骤: 读...
    Vivus阅读 243评论 0 0
  • 伯禹 文本预处理课程学习 文本预处理 一般的文本预处理步骤: 分词(中英文不同,中文分词难度大一些,有一些分词工具...
    hc2zzcj阅读 107评论 0 0
  • “君生我未生,我生君已老。等闲变却故人心,却道故人心易变!锦瑟无端五十弦,一弦一柱思华年……” 感到身后...
    苦芭阅读 480评论 1 1