Ответ на пост «Настоящие подонки находятся именно среди бедноты...»5
Давайте попробуем разобраться с точки зрения статистики, лучше известной как здравый смысл. А то все начали проецировать свои политические взгляды вместо того, чтобы расчехлить мат аппарат и им трезво проанализировать данные.
Вот разбивка по классам и факту спаслись или нет (скопировал из другого комментария и сверил с Википедией)
Теперь нам нужно определить как будем считать и что будем считать.
Что считать?
Будем проверять насколько соблюдалось правило "женщины и дети вперёд" среди пассажиров разных классов.
Как считать?
Нельзя просто считать, всегда используется какая-то изначальная модель, на которую уже применяются статистические данные.
Изначальную модель можно использовать простую, например, что ничего не знаем про внутреннюю логистику эвакуации и вообще ничего не знаем о Титанике и делаем допущение, что эвакуация трёх классов и экипажа была независимой друг от друга и смотрим насколько "быть женщиной" или "быть ребёнком" увеличивает шансы выжить для каждого класса (I,II,III и экипаж).
Ну или можно сделать более сложную модель, разобраться с логистикой процесса эвакуации и применить статистические данные к сложной модели.
Простая модель.
Для начала, оценим среднюю величину того как шансы возрастают от бытия женщиной в разных классах. Поскольку сейчас мы делаем грубую оценку, сделаем маленький финт и добавим по 1 человеку в каждую группу в табличке чтобы избежать деления на ноль. Это сильно ничего не поменяет, но чтобы примерно прикинуть - это подходит.
Вы оказались на Титанике. Если Вы женщина/ребёнок или мужчина - как это меняет шансы выжить относительно вашего класса?
В табличке ниже смотрите на цифры RR (относительный риск умереть).
Если Вы женщина из первого класса, то риск для Вас составит одну двадцатую от среднего риска по первому классу, а если мужчина - то риск возрастает почти в 15 раз.
ну или то же самое, только женщин и детей объединим
Это не относится к проверяемой гипотезе, но многим также интересно.
Если Вы оказались на Титанике - то шанс погибнуть - 68%.
Вы смотрите на то какой у Вас билет.
Если это 1 класс, то Ваш относительный риск умереть почти вдвое меньше, чем в среднем (RR=0.55). Для второго класса RR = 0.86, для третьего класса риск на 10% выше среднего, если билета нет, но есть фуражка сотрудника - риск на 12% выше.
То есть класс тоже влияет на шанс выжить, но в меньшей степени, чем пол.
Давайте посчитаем не только прикидку среднего, а вообще распределение вероятностей величины женско-детского приоритета по классам. Всё-таки это вопрос вероятностей.
Если брать из простого - то самое ближнее что имеем тут - биноминальное рапсределение. В шлюпку попадает (а значит и спасается) либо мужчина либо женщина. Вероятность, что будет выбрана женщина или ребёнок выше, чем вероятность что это будет мужчина. И нас интересует насколько выше и как это отличается среди разных классов.
Вот такая плотность распределения вероятности получается. Бирюзовым идёт команда, но очевидно, биноминальное распределение для неё не подходит, т.к. в команде было мало женщин и они быстро все были рассажены.
Интересно, что при такой простой модели - картина уже получается что не первый класс, а второй в большей степени учитывал интересы женщин и детей.
Чуть более сложная модель
Какие минусы у простой модели? Плохо, что модель не учитывается истощение пула мужчин и женщин. Например, кривая, обозначающая команду из-за этого не попала на график, что там было только 23 женщины. 20 из них спасли и начали сажать мужчин. Для этого нужно гипергеометрическое распределение, а не биноминальное. Мне сейчас лень это делать, но если пост наберёт 1000 плюсов - может быть сделаю.
Скорее всего, второй класс будет ещё в лучшем свете, а первый - чуть похуже и ближе к третьему.
Действительно хорошая модель
Чтобы сделать действительно крутую статистику к сожалению нужно быть экспертом по Титанику, а не по статистике (и по ней тоже).
Дело в том, что предыдущие модели изначально говорят - мы не знаем как там всё было на Титанике - а посему предполагаем что-то средненькое и простое и применяем к этому цифры.
На самом же деле, есть подробные разборы того как происходила логистика эвакуации. И эти вещи можно учитывать. Можно смоделировать конкуренцию между классами, между мужчинами и женщинами в соответствии с тем как оно было - в общем как душа пожелает. Какие-то очень вещи сложно учесть, на грани нереального, какие-то проще, но это возможно. Лично меня настораживает тот момент, что пишут, что шлюпки были полупустые. И мне не очень понятно при какой модели они будут полупустыми.
P.S. спустя час:
Если нигде не ошибся - то вот гипергеометрическое распределение
P.P.S.: Вы не поверите, но посту ставят минусы, хотя потратил несколько часов своего времени, чтобы сделать статистику. Из 554 комментариев никто не сделал просто статистику с холодной головой, все высказывают мнения.