出现频率最高的字母

题目:

头号通缉字母 The most wanted letter

给你一段文本,其中包含不同的英文字母和标点符号。
你要找到其中那个出现 最多字母,返回的字母必须是 小写形式
注意不要管标点符号、数字和空格,只要字母!

如果你找到 两个或两个以上出现频率相同的字母, 那么返回字母表中靠前的那个。 例如“one”包含“o”、“n”、“e”每个字母一次,因此我们选择“e”。


代码实现:

# coding: utf-8
def wanted(text):
    target_letter = ''
    target_count = 0
    for i in range(len(text)):
        count = text.count(text[i])
        if not text[i].isalpha() or target_letter == text[i]:
            # 避免重复判断
            continue
        if count == target_count:
            # 比较字母表顺序
            orders = [text[i], target_letter]
            orders.sort()
            target_letter = orders[0]
        elif count > target_count:
            target_count = count
            target_letter = text[i]
    return [target_letter, target_count]

res = wanted('abbc,,c,,,ccffffddddd')

print (res)

运行结果:

['d', 5]

这类算法可被用于密码破解。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容