python统计一个英文文本中的单词出现的频次

import re

def find_word_freq(file):

    file1= open(file,'r')

    lines = file1.readlines() #读取全部内容

    dic ={}

    for line in lines:

        re.sub(r'[?.!,""/]",'  ',line) #特殊字符替换成空格

        re.sub(r" - "," ",line) #替换单独的-,不是同一单词里的连字符

        for word in line.split():#分隔默认以空格分

                if word[-1]="-":

                    has_lianjie =True

                    m=word[:-1]

                    break

                if has_lianjie:

                    has_lianjie= False

                    word = m+word

                dic.setdefault(word.lower(),0)

                dic[word.lower()]+=1

        print dic





find_word_freq("D:\pythonex\eng1.txt")

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 9,959评论 0 5
  • 快节奏生活方式已经慢慢吞噬现代人的心灵和身体,身日渐发胖的人群已经超过了人口的一半,如此快节奏的跟上欧美国家的体积...
    RonaldMcDonald阅读 7,473评论 16 47
  • 回顾一路, 始终保持用一种明月清风的方式来处理心里的孤独, 更为清静淡定的来审视人生曾经的失落, 于是, 些许伤痕...
    LeylaYY阅读 1,621评论 0 0
  • 正式进入30岁的第一天,重温了《新闻编辑室》第一季,因为在29岁的最后一天终于补档完了第三季。 上次看《新闻编辑室...
    原名太没激励性了阅读 1,666评论 0 0
  • 目前,青岛西海岸地区的开发建设进行得如火如荼,大量棚户区纳入改造范围,大量农民集体用地被征收,建设了大量商...
    兔兔是淑女阅读 1,531评论 0 0

友情链接更多精彩内容