Python/strings/frequency_finder.py

# Frequency Finder

import string

# frequency taken from http://en.wikipedia.org/wiki/Letter_frequency
english_letter_freq = {
    "E": 12.70,
    "T": 9.06,
    "A": 8.17,
    "O": 7.51,
    "I": 6.97,
    "N": 6.75,
    "S": 6.33,
    "H": 6.09,
    "R": 5.99,
    "D": 4.25,
    "L": 4.03,
    "C": 2.78,
    "U": 2.76,
    "M": 2.41,
    "W": 2.36,
    "F": 2.23,
    "G": 2.02,
    "Y": 1.97,
    "P": 1.93,
    "B": 1.29,
    "V": 0.98,
    "K": 0.77,
    "J": 0.15,
    "X": 0.15,
    "Q": 0.10,
    "Z": 0.07,
}
ETAOIN = "ETAOINSHRDLCUMWFGYPBVKJXQZ"
LETTERS = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"


def get_letter_count(message: str) -> dict[str, int]:
    letter_count = {letter: 0 for letter in string.ascii_uppercase}
    for letter in message.upper():
        if letter in LETTERS:
            letter_count[letter] += 1

    return letter_count


def get_item_at_index_zero(x: tuple) -> str:
    return x[0]


def get_frequency_order(message: str) -> str:
    letter_to_freq = get_letter_count(message)
    freq_to_letter: dict[int, list[str]] = {
        freq: [] for letter, freq in letter_to_freq.items()
    }
    for letter in LETTERS:
        freq_to_letter[letter_to_freq[letter]].append(letter)

    freq_to_letter_str: dict[int, str] = {}

    for freq in freq_to_letter:
        freq_to_letter[freq].sort(key=ETAOIN.find, reverse=True)
        freq_to_letter_str[freq] = "".join(freq_to_letter[freq])

    freq_pairs = list(freq_to_letter_str.items())
    freq_pairs.sort(key=get_item_at_index_zero, reverse=True)

    freq_order: list[str] = [freq_pair[1] for freq_pair in freq_pairs]

    return "".join(freq_order)


def english_freq_match_score(message: str) -> int:
    """
    >>> english_freq_match_score('Hello World')
    1
    """
    freq_order = get_frequency_order(message)
    match_score = 0
    for common_letter in ETAOIN[:6]:
        if common_letter in freq_order[:6]:
            match_score += 1

    for uncommon_letter in ETAOIN[-6:]:
        if uncommon_letter in freq_order[-6:]:
            match_score += 1

    return match_score


if __name__ == "__main__":
    import doctest

    doctest.testmod()
initial 2016-08-18 12:59:10 +00:00			`# Frequency Finder`

Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`import string`

initial 2016-08-18 12:59:10 +00:00			`# frequency taken from http://en.wikipedia.org/wiki/Letter_frequency`
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`english_letter_freq = {`
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00			`"E": 12.70,`
			`"T": 9.06,`
			`"A": 8.17,`
			`"O": 7.51,`
			`"I": 6.97,`
			`"N": 6.75,`
			`"S": 6.33,`
			`"H": 6.09,`
			`"R": 5.99,`
			`"D": 4.25,`
			`"L": 4.03,`
			`"C": 2.78,`
			`"U": 2.76,`
			`"M": 2.41,`
			`"W": 2.36,`
			`"F": 2.23,`
			`"G": 2.02,`
			`"Y": 1.97,`
			`"P": 1.93,`
			`"B": 1.29,`
			`"V": 0.98,`
			`"K": 0.77,`
			`"J": 0.15,`
			`"X": 0.15,`
			`"Q": 0.10,`
			`"Z": 0.07,`
			`}`
			`ETAOIN = "ETAOINSHRDLCUMWFGYPBVKJXQZ"`
			`LETTERS = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"`

initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`def get_letter_count(message: str) -> dict[str, int]:`
			`letter_count = {letter: 0 for letter in string.ascii_uppercase}`
initial 2016-08-18 12:59:10 +00:00			`for letter in message.upper():`
			`if letter in LETTERS:`
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`letter_count[letter] += 1`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`return letter_count`
initial 2016-08-18 12:59:10 +00:00
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`def get_item_at_index_zero(x: tuple) -> str:`
initial 2016-08-18 12:59:10 +00:00			`return x[0]`

psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`def get_frequency_order(message: str) -> str:`
			`letter_to_freq = get_letter_count(message)`
			`freq_to_letter: dict[int, list[str]] = {`
			`freq: [] for letter, freq in letter_to_freq.items()`
			`}`
initial 2016-08-18 12:59:10 +00:00			`for letter in LETTERS:`
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`freq_to_letter[letter_to_freq[letter]].append(letter)`

			`freq_to_letter_str: dict[int, str] = {}`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`for freq in freq_to_letter:`
			`freq_to_letter[freq].sort(key=ETAOIN.find, reverse=True)`
			`freq_to_letter_str[freq] = "".join(freq_to_letter[freq])`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`freq_pairs = list(freq_to_letter_str.items())`
			`freq_pairs.sort(key=get_item_at_index_zero, reverse=True)`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`freq_order: list[str] = [freq_pair[1] for freq_pair in freq_pairs]`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`return "".join(freq_order)`
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`def english_freq_match_score(message: str) -> int:`
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00			`"""`
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`>>> english_freq_match_score('Hello World')`
initial 2016-08-18 12:59:10 +00:00			`1`
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00			`"""`
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`freq_order = get_frequency_order(message)`
			`match_score = 0`
			`for common_letter in ETAOIN[:6]:`
			`if common_letter in freq_order[:6]:`
			`match_score += 1`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`for uncommon_letter in ETAOIN[-6:]:`
			`if uncommon_letter in freq_order[-6:]:`
			`match_score += 1`
initial 2016-08-18 12:59:10 +00:00
Add missing type annotations for `strings` directory (#5817) * Type annotations for `strings/autocomplete_using_trie.py` * Update autocomplete_using_trie.py * Update detecting_english_programmatically.py * Update detecting_english_programmatically.py * Update frequency_finder.py * Update frequency_finder.py * Update frequency_finder.py * Update word_occurrence.py * Update frequency_finder.py * Update z_function.py * Update z_function.py * Update frequency_finder.py 2022-05-13 05:55:53 +00:00			`return match_score`
initial 2016-08-18 12:59:10 +00:00
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00
			`if __name__ == "__main__":`
initial 2016-08-18 12:59:10 +00:00			`import doctest`
psf/black code formatting (#1277) 2019-10-05 05:14:13 +00:00
initial 2016-08-18 12:59:10 +00:00			`doctest.testmod()`