2022-03-03 第三章 课后习题

  • 3.1 使用NLTK工具下载简·奥斯汀所著的Emma小说原文,并去掉其中的停用词。
  • 3.2 使用NLTK提供的WordNet计算两个词(不是词义)的相似度,计算方法为两词各种词义之间的最大相似度。
  • 3.3 使用NLTK提供的SentiWordNet工具计算一个句子的情感倾向性,计算方法为每个词所处词性下的每个词义情感倾向性之和。
  • 3.4 使用真实文本对比LTP与正向最大匹配分词的结果,并人工分析哪些结果LTP正确,正向最大匹配错误;哪些结果LTP错误,正向最大匹配正确;以及哪些结果两个结果都错误。
  • 3.5 分析view、reshape、transpose和permute四种调整张量形状方法各自擅长处理的问题。
  • 3.6 安装PyTorch并实际对比使用和不使用GPU时,三个大张量相乘时的效率。
  • 3.7 下载最新的Common Crawl数据,并实现抽取中文、去重、繁简转换、数据清洗等功能。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容