自然语言处理实验演示 - 22. 移除文本停用词 停用词 (Stop Words),经常出现在文本数据中。虽然它们帮助我们正确地构造句子,但即使...
自然语言处理实验演示 - 21. 文本翻译 从一种语言到另一种语言的文本翻译在各种网站中越来越普遍。我们可以通过各种工具库执行此操作。当然,大部...
自然语言处理实验演示 - 20. 单复数变换 TextBlob 是一个用 Python 编写的开源的文本处理库,属于 NLTK 的扩展库。它可以...
自然语言处理实验演示 - 19. 执行词形还原(Lemmatization) 词形还原(Lemmatization)是文本预处理中的重要部分,与...
自然语言处理实验演示 - 18. Porter 词干提取 Porter 词干提取是最常用的词干提取算法之一,其基本原理是删除和替换英语中众所周知...
自然语言处理实验演示 - 17. RegexpStemmer 词干提取 词干提取 (Stemming) 是英文语料预处理的其中一个必要步骤,英语...
自然语言处理实验演示 - 16. 高级文本分词器 除了基本的文本分词word_tokenize,NLTK 还提供了更多的针对特定 NLP 任务的...
自然语言处理实验演示 -15. Keras TextBlob 文本分词 事实上,并不存在一个单一的工具库能解决全部的 NLP 业务需求。因此,你...
自然语言处理实验演示 - 14. N-Gram 模型应用 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行...