240 发简信
IP属地:湖北
  • 120
    2022-04-03

    自然语言处理实验演示 - 22. 移除文本停用词 停用词 (Stop Words),经常出现在文本数据中。虽然它们帮助我们正确地构造句子,但即使我们去掉它们,我们也领会语句的...

  • 120
    2022-04-03

    自然语言处理实验演示 - 21. 文本翻译 从一种语言到另一种语言的文本翻译在各种网站中越来越普遍。我们可以通过各种工具库执行此操作。当然,大部分在线翻译引擎都会有次数或者收...

  • 120
    2022-04-02

    自然语言处理实验演示 - 20. 单复数变换 TextBlob 是一个用 Python 编写的开源的文本处理库,属于 NLTK 的扩展库。它可以用来执行很多自然语言处理的任务...

  • 120
    2022-04-01

    自然语言处理实验演示 - 19. 执行词形还原(Lemmatization) 词形还原(Lemmatization)是文本预处理中的重要部分,与词干提取(stemming)很...

  • 120
    2022-03-24

    自然语言处理实验演示 - 18. Porter 词干提取 Porter 词干提取是最常用的词干提取算法之一,其基本原理是删除和替换英语中众所周知的单词后缀、前缀和复数s。NL...

  • 120
    2022-03-24

    自然语言处理实验演示 - 17. RegexpStemmer 词干提取 词干提取 (Stemming) 是英文语料预处理的其中一个必要步骤,英语单词在句子中使用时会转化成各种...

  • 120
    2022-03-23

    自然语言处理实验演示 - 16. 高级文本分词器 除了基本的文本分词word_tokenize,NLTK 还提供了更多的针对特定 NLP 任务的高级文本分词标记工具。在本实验...

  • 120
    2022-03-23

    自然语言处理实验演示 -15. Keras TextBlob 文本分词 事实上,并不存在一个单一的工具库能解决全部的 NLP 业务需求。因此,你需要了解并掌握更多的工具来丰富...

  • 120
    2022-03-22

    自然语言处理实验演示 - 14. N-Gram 模型应用 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形...

  • 120
    2022-03-21

    自然语言处理实验演示 - 13. 文本清洗和分词 我们将学习更多的文本数据预处理步骤,以及如何从预处理文本中提取特征,并将它们转换为向量。在本实验中,我们将对文本进行简单的清...

  • 120
    2022-03-21

    自然语言处理实验演示 - 12. Raw 文本数据预处理 在本案例中,我们将处理一个格式不正确的文本语料库。我们将执行前面讨论过的所有预处理步骤,以获得文本的真实含义。 #知...

  • 120
    2022-03-20

    自然语言处理实验演示 - 11. 语句边界检测 语句边界检测,是检测一个句子在哪里结束,另一个句子在哪里开始的方法。这对于中文而言很简单,因为句号(。)或问号(?)表示一个句...

  • 120
    2022-03-20

    自然语言处理实验演示 - 10. 词义消歧(Word Sense Disambiguation) 一个词的意思取决于它与句子中其他词的关联。这意味着拼写相同的单词在不同的上下...

  • 120
    2022-03-19

    自然语言处理实验演示 - 09. 命名实体识别(Named Entity Recognition (NER)) 命名实体识别(Named Entity Recognition...

  • 120
    2022-03-19

    自然语言处理实验演示 - 08. 词形还原(Lemmatization) 词形还原和词干提取比较相似,将一个任意形式的单词转换为语法基础形式。然而,词形还原是基于词典的,每种...

个人介绍
人工智能科研教学一体化实验平台|人工智能专业建设|人工智能实验室 | 项目案例