字母组合计算

确定常用单词的各种字母组合频率

1.将单词切分成不同的字母组合
2.计算每个字母组合出现的次数

编码实现

#coding=utf-8
import fileinput
from collections import Counter
testword="find"
minslice=2
maxslice=5
cutnumber=2

def cut_word(inword,slicenumber):
    ddd=[]
    lenb=len(inword)
    for i in range(0,lenb,slicenumber):
        abc= inword[i:i+slicenumber]
        if len(abc)==slicenumber:
            ddd.append(abc)
    return ddd

def get_slice_list(inword,slicenumber):
    lll=[]
    lena=len(inword)
    for i in range(lena):
        aaa=inword[i:]
        lll.extend(cut_word(aaa,slicenumber))
        mylist=list(set(lll))
    return mylist

def get_all_slice_list(inword):
    lll=[]
    for i in range(minslice,maxslice+1):
        lll.extend(get_slice_list(inword,i))
    return lll

alllist=[]
for line in fileinput.input( "1.txt" ):
    aaa=line.rstrip()
    print "read   :%s"%(aaa)
    alllist.extend(get_all_slice_list(aaa))
c=Counter(alllist).most_common()


print "##########begin write file..."
output = open('jieguo.txt', 'w')
for i in c:
    output.write("%s,%d\n"%i)
output.close()

print "##########write end"
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • CTF中那些脑洞大开的编码和加密 0x00 前言 正文开始之前先闲扯几句吧,玩CTF的小伙伴也许会遇到类似这样的问...
    查无此人asdasd阅读 6,121评论 0 19
  • 0x01 目录 常见编码: ASCII编码 Base64/32/16编码 shellcode编码 Quoted-p...
    H0f_9阅读 13,081评论 2 17
  • 我在简书原来的账号叫叶舟,是自己用豆瓣注册的。十一月份的时候注销了豆瓣,忘了先把关联账号解决一下,寒假的时候想要用...
    叶诺舟阅读 182评论 0 1
  • 莫道轻寒无尽时,长堤绿柳弄新姿。 紫燕斜穿鸳鸯戏,旖旎,玉箫声起翠沾衣。 红杏李桃催细雨,鼓舞,纶巾白马不知归。 ...
    眉间飞雪阅读 360评论 34 15
  • 黑暗 我眼前只有黑暗 畏惧寒冷 向我袭来 我奋力的寻找 寻找一丝丝的光明 终于 我找到了 一盏昏黄的灯 光芒照进了...
    ZZZ婷婷0_0阅读 222评论 0 0