...мы посчитаем сколько ребят!
Пришла мне вчера в голову идея совместить две статистики. Первая - демографическая пирамида, которая показывает как меняются поколения в стране.
На всякий случай поясню, как она устроена: вертикальная черта - это возраст, снизу новорождённые, сверху столетние старики. Слева - количество мужчин, справа - количество женщин в этом возрасте. Более тёмным цветом показан перевес одного пола над другим.
По ней мы можем увидеть разные штуки: демографический провал от ВМВ, видимо эхо от него через 20 лет, а также провал в 90х. Также видно, что до ~35лет количество мужчин больше количества женщин.
Но это ж не может быть ответом! Нельзя просто взять и поделить одних на других по возрасту, мы встречаемся не только с одногодками.
Более того, есть важная культурная особенность, в которой мы всё-таки живём. Кратко она формулируется так:
- мужчина старше женщины - это ок
- женщина старше мужчины - не ок
И я нашёл эту статистику для браков, правда, только для США:
Скачав эти данные, загрузив их в память, отнормировав и интерполируя, получим следующие графики уже у себя в программе:
Та же демографическая пирамида, только в виде классического графика: зависимость населения от возраста
Та же статистика по разнице возраста в браке, только в виде зависимости частота от разницы между возрастом мужчины и женщины
Осталось понять, как нам совместить эти два графика. Для начала, посмотрим на второй и разберёмся, что на нём изображено. Чуть-чуть переформулируем описание с Вики и получим вот что: этот график показывает как на женщин в возрасте Х в среднем женятся мужчины в возрасте от Х-20 до Х+20
Ещё раз, другими словами: по этому графику виден максимум по средней линии: это показывает, что женщина любого возраста скорее всего замужем за ровесником. Правая часть графика показывает шанс, что женщина младше мужчины. Левая, соответственно, наоборот.
Итак, для совмещения этих статистик нам понадобится математическая операция свёртка. Уж что это за операция, я расписывать не буду. Ограничусь ссылкой на Википедию и картинкой оттуда же. Если совсем кратко, то это позволит нам из двух функций сделать новую:
Сделав свёртку, мы получим:
синим - скольким мужчинам (У) хотелось бы найти женщин возраста Х
оранжевым - скольким женщинам (У) хотелось бы найти мужчин возраста Х
Обратите внимание: на просто графике по демографии у мужчин и женщин был одинаковый пик в районе 30 лет. На этом же графике этот пик разъехался, потому что мужчины в среднем хотели бы супруга помладше, и их синий график чуть уехал влево, а женщины предпочли бы мужчин постарше, и их оранжевый график спроса уехал вправо.
Что осталось? Да просто поделить спрос на предложение, и получим, насколько востребован человек данного пола в относительных единицах
Горизонтальная линия показывает "нейтральную ситуацию" на рынке брака: если спрос на кого-то к их количеству равен 1, то в среднем человеку ни просто, ни сложно найти отношения. Если больше 1, то человеку легко найти отношения в данной точке. Если меньше 1, то сложно.
По полученным данным получается, что в возрасте 22 лет у девушек пик популярности с учётом демографической обстановки. Самые же невостребованные мужчины в возрасте 29 лет. В целом, до 35 лет девушкам легче найти спутника по жизни, чем мужчинам того же возраста.
Я не стал включать крайние левые и крайние правые значения по возрасту: до 18 в брак особо не вступают, после 50 высокая мужская смертность вызывает нереальный перекос в графиках. Также на эти проблемы накладываются краевые эффекты свёртки.
Но это ещё не всё! Мне пришла в голову идея ввести антипедофильскую поправку. Выглядит она так:
Спрос на мужчин и женщин <18 лет обнуляем. В добавок, это частично может отражать мобильность людей по достижению совершеннолетия, когда куча молодых парней и девушек переезжает в общаги и начинает учиться в ВУЗах. Они оказываются в среде, резко оторванной от школьников, и начинают жить среди более взрослых людей. И вот что у меня получилось:
ФИНАЛЬНЫЙ РЕЗУЛЬТАТ:
- НА 10 ДЕВЧОНОК ДО 28 ЛЕТ ПО СТАТИСТИКЕ 10-12 РЕБЯТ
- НА 10 ДЕВЧОНОК ПОСЛЕ 32 ЛЕТ ПО СТАТИСТИКЕ 9 РЕБЯТ
В целом, оба графика в левой части уползли вниз, то есть спрос на них упал, но мужской уполз сильно больше. Сохранилась тенденция, что до 35 лет женщинам проще найти спутника, чем мужчинам того же возраста. Особенно сильна эта тенденция до ~28 лет. После чего ситуация обращается и становится более-менее линейной.
TODO: вообще-то говоря, просто обрезать спрос не совсем корректно в рамках данной поправки. По идее, стоило сделать примерно так: мужчины возраста 19 лет, вместо того, чтобы обращать внимание на 17-летних, должны были перенести это внимание на 18-летних, ну и так далее, и наоборот. К сожалению, я поленился это реализовать. Это должно было бы охрененно повысить спрос на 18-летних, особенно девушек из-за асимметричности ядра свёртки.
Ну и для желающих посмотреть, что там в правой части. А там вот что: огромная мужская смертность и эхо войны.
Специально для лиги Упоротых Расчётов!