跨象乘云 - 简书

跨象乘云

2022-04-03

自然语言处理实验演示 - 22. 移除文本停用词停用词 (Stop Words)，经常出现在文本数据中。虽然它们帮助我们正确地构造句子，但即使我们去掉它们，我们也领会语句的...

261 0 0

跨象乘云

2022-04-03

自然语言处理实验演示 - 21. 文本翻译从一种语言到另一种语言的文本翻译在各种网站中越来越普遍。我们可以通过各种工具库执行此操作。当然，大部分在线翻译引擎都会有次数或者收...

171 0 0

跨象乘云

2022-04-02

自然语言处理实验演示 - 20. 单复数变换 TextBlob 是一个用 Python 编写的开源的文本处理库，属于 NLTK 的扩展库。它可以用来执行很多自然语言处理的任务...

221 0 0

跨象乘云

2022-04-01

自然语言处理实验演示 - 19. 执行词形还原（Lemmatization）词形还原（Lemmatization）是文本预处理中的重要部分，与词干提取（stemming）很...

215 0 0

跨象乘云

2022-03-24

自然语言处理实验演示 - 18. Porter 词干提取 Porter 词干提取是最常用的词干提取算法之一，其基本原理是删除和替换英语中众所周知的单词后缀、前缀和复数s。NL...

270 0 0

跨象乘云

2022-03-24

自然语言处理实验演示 - 17. RegexpStemmer 词干提取词干提取 (Stemming) 是英文语料预处理的其中一个必要步骤，英语单词在句子中使用时会转化成各种...

220 0 0

跨象乘云

2022-03-23

自然语言处理实验演示 - 16. 高级文本分词器除了基本的文本分词word_tokenize，NLTK 还提供了更多的针对特定 NLP 任务的高级文本分词标记工具。在本实验...

152 0 0

跨象乘云

2022-03-23

自然语言处理实验演示 -15. Keras TextBlob 文本分词事实上，并不存在一个单一的工具库能解决全部的 NLP 业务需求。因此，你需要了解并掌握更多的工具来丰富...

162 0 0

跨象乘云

2022-03-22

自然语言处理实验演示 - 14. N-Gram 模型应用 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作，形...

191 0 0

跨象乘云

2022-03-21

自然语言处理实验演示 - 13. 文本清洗和分词我们将学习更多的文本数据预处理步骤，以及如何从预处理文本中提取特征，并将它们转换为向量。在本实验中，我们将对文本进行简单的清...

202 0 0

跨象乘云

2022-03-21

自然语言处理实验演示 - 12. Raw 文本数据预处理在本案例中，我们将处理一个格式不正确的文本语料库。我们将执行前面讨论过的所有预处理步骤，以获得文本的真实含义。 #知...

336 0 0

跨象乘云

2022-03-20

自然语言处理实验演示 - 11. 语句边界检测语句边界检测，是检测一个句子在哪里结束，另一个句子在哪里开始的方法。这对于中文而言很简单，因为句号(。)或问号(？)表示一个句...

506 0 0

跨象乘云

2022-03-20

自然语言处理实验演示 - 10. 词义消歧（Word Sense Disambiguation）一个词的意思取决于它与句子中其他词的关联。这意味着拼写相同的单词在不同的上下...

274 0 0

跨象乘云

2022-03-19

自然语言处理实验演示 - 09. 命名实体识别（Named Entity Recognition (NER)）命名实体识别（Named Entity Recognition...

224 0 0

跨象乘云

2022-03-19

自然语言处理实验演示 - 08. 词形还原（Lemmatization）词形还原和词干提取比较相似，将一个任意形式的单词转换为语法基础形式。然而，词形还原是基于词典的，每种...

155 0 0