Python 练习册 0004、0006题 (统计文本)

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数
第 0006 题:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。

这里把最重要的词当作出现频率最高的词来查找

答案

from collections import Counter

# 统计某一单词出现次数
with open('find.txt', 'r') as f:
    word_list = f.read().split(' ')
    word = input('输入要查找到的单词:')
    num = Counter(word_list).get(word)
    if not num:
        num = 0
    print('{}: {}'.format(word, num))


# 统计日记文本中最重要的词
with open('find.txt') as f:
    word_list = f.read().split(' ')
    top_word = Counter(word_list).most_common(1)[0]

    print('此文本中频率最高的词是:{}'.format(list(top_word)[0]))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 刚刚学了Python一点皮毛,找东西来练手巩固一下从知乎上看的 Python 练习册,每天一个小程序 第 0000...
    Arudora阅读 811评论 0 51
  • 欢迎关注我的公众号:读书主义 更多精彩等着你! 这个读书方法,可能会颠覆你对读书以往的认知|开卷 或许读书已经成为...
    米米粒粒阅读 34,767评论 9 209
  • Python 练习册,每天一个小程序,原题来自Yixiaohan/show-me-the-code我的代码仓库在G...
    王鹏程Orange阅读 1,404评论 2 2
  • 常用概念: 自然语言处理(NLP) 数据挖掘 推荐算法 用户画像 知识图谱 信息检索 文本分类 常用技术: 词级别...
    御风之星阅读 9,268评论 1 25
  • 如梦初醒的人生。多少仓促告别,多少漠然回首,成长中的我们经历了多少,我们还能经历什么。所有的事情不需要原因就会...
    凉渡阅读 342评论 0 0