#!/usr/bin/env python
# -*- coding: utf-8 -*-
def getSetOfWords(words):
'''
统计出文本中所有有的字符
'''
myset = set()
for ch in words:
if ch in myset:
pass
else:
myset.add(ch)
return myset
def getResult(words):
'''
返回统计结果(字典)
'''
result = {}
myset = getSetOfWords(words)
for ch in myset:
result[ch]=words.count(ch)
return result
words = input("Please input the words : ")
print getResult(words)
Python词频统计
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 中文分词: 我的家乡可以分为 我 的 家乡 停用词 数据处理,需要过来的词语和子 如web,网址等 语气助词、副词...
- 词频计算部分 原数据从mysql中获取. 我要统计返回行tag属性中包含的tag词频。 返回数据的每一个row都是...
- 利用python统计《十九大报告》中的关键词、报告摘要和词频。引用snowNLP。得到的结果: 1、关键词:前五个...
- 在中文的文本挖掘中,对海量文本进行准确分词是其中至关重要一步。当前的Python语言下存在多种开源文本分析包,其中...