Частота букв в русском языке

Буквы
Нам с коллегой Владимиром Терентьевым внезапно показалось любопытным узнать, как и как часто мы в русском языке используем те или иные буквы. Для этого был проанализирован Полный орфографический словарь русского языка.
Какая буква на каком месте?
Первая задача была в том, чтобы показать распределение использования буквы в разных частях слова.
Частота букв в русском языке Русский язык, Визуализация, Интересное, Не мое, Длиннопост
В качестве единиц измерения используется коэффициент: полученные данные были пересчитаны так, чтобы оценить положение буквы относительно слова, при этом не учитывая его длину. Кстати чаще всего в словаре встречаются слова из 9 и 10 букв, но попадаются и длиной в 29 знаков.
Частота букв в русском языке Русский язык, Визуализация, Интересное, Не мое, Длиннопост
Как буквы сочетаются?
«Ть, ть, ть», — повторило привычное эхо
Еще нам показалось интересным узнать, как буквы сочетаются с другими, и какие пары используются в словах русского языка чаще.
В данном случае уже можно говорить о буквальной частоте встречаемости пар как о единицах измерения. Однако, я сохранила преемственность в легенде.
Частота букв в русском языке Русский язык, Визуализация, Интересное, Не мое, Длиннопост
Свой финальный выбор я остановила на хитмапе. Изначально идея была визуализировать размерами букв, получить, фактически, облако сочетаний знаков. Однако, из-за сложности форм она не сработала, читаемость как данных, так и самих букв была очень низкой. Естественно, я попробовала с более простыми формами и сделала пузырьковую диаграмму, но полученный результат эстетически меня не устроил.

Nadya Andrianova

Вы смотрите срез комментариев. Показать все
328
Автор поста оценил этот комментарий

Позвольте доебаться

Иллюстрация к комментарию
раскрыть ветку (27)
199
Автор поста оценил этот комментарий

минуту искал ошибку. И правду говорят, что мозг сам слова додуымвает, а не читает их полонстью.

Иллюстрация к комментарию
раскрыть ветку (9)
98
Автор поста оценил этот комментарий

Увидел только после вашей подсказки :D

раскрыть ветку (7)
4
Автор поста оценил этот комментарий
Не баг, а фича)
Автор поста оценил этот комментарий
Подсказки?! Да он указал на нее.
Автор поста оценил этот комментарий
А в комменте?
ещё комментарии
2
Автор поста оценил этот комментарий

не то, чтобы додумывает, а воспринимает целиком, а не по буквам

54
Автор поста оценил этот комментарий

Самые используемые буквы на клаве - это Ц,Ф,Ы,В !!!

раскрыть ветку (10)
30
Автор поста оценил этот комментарий

У некоторых, возможно, Й, Ц, У, К.

раскрыть ветку (8)
1
Автор поста оценил этот комментарий

Это у кого?

раскрыть ветку (7)
32
Автор поста оценил этот комментарий
У инвокеров же.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий
А ведь были времена...
Кто скилл поднять свой хочет, на легаси играть должен он...
4
Автор поста оценил этот комментарий
У игроков в MOBA, например
ещё комментарии
Автор поста оценил этот комментарий
У придумывателей паролей
Автор поста оценил этот комментарий

Точно! "Ц"! У меня на клаве эта буква уже давно стерлась.

13
Автор поста оценил этот комментарий

Всё же очепятка, а не офрографическая ошибка)

раскрыть ветку (1)
56
Автор поста оценил этот комментарий
Афрографическая ошибка? Где?
Иллюстрация к комментарию
3
Автор поста оценил этот комментарий

Самое частое слово должно начинаться на П, кончатся на ть, и быть длиной 9-10 знаков, хмм... Проверить!

Автор поста оценил этот комментарий
Прикольно
ещё комментарии
Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку