Python 练习册 6-找出重要的单词

题目取自Yixiaohan的python练习册

题目

你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词

代码

"""
 你有一个目录,放了你一个月的日记,都是txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
"""
from collections import Counter

import os


def get_diary_path():
    list = []
    dir_path = './diary'
    for path in os.listdir(dir_path):
        list.append(dir_path + '/' + path)
    return list


def get_common_word(paths):
    common_words = []
    for path in paths:
        words = []
        with open(path, 'r') as f:  # 打开文件
            for line in f:
                line = line.strip('\n')  # 去掉每行后面的换行符
                if line != '':  # 去掉空行
                    split = str(line).split(' ')
                    words.extend(split)
        common_word = Counter(words).most_common(1)  # 获取此篇中出现频率最高的一个词汇
        common_words.append(common_word)
    return common_words


if __name__ == '__main__':
    paths = get_diary_path()
    words = get_common_word(paths)
    print(words)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容