Столото vs. математика. Ничья.
Вчера увидел пост господина @uncleHarry про лотерею столото (https://pikabu.ru/story/stoloto_moya_versiya__kak_tam_zhulni...). Там он посчитал некие математические факты, которые якобы подтверждают, что столото - нае обман. В общем-то, этот пост уже разоблачил @aapr (#comment_103823514) но раз уж я тоже начал проверять, то и я решил запилить пост.
Краткий итог - факты, представленные @uncleHarry посчитаны с ошибками и таким способом к лотерее не подкопаться.
На самом деле, это ни капельки не удивительно, ведь если в каждой лотерее убирать разные шары, то на большом массиве данных (и я говорю даже не о миллионах тиражей, достаточно несколько сотен), все несостыковки нивелируют друг друга и обман будет вскрыть невозможно.
Итак, что я сделал:
1. Скачал все результаты лотерей столото 6 из 45 (в 5 из 36 было по 6 шариков и я не понял, как считается победитель, я взял наиболее простую для моего понимания) с самого начала (вроде 2013 или 2014 год) и до конца 2017 года (3392 тиража).
2. Сгенерировал пул из 25000 тиражей лотереи. Далее, несколько раз (я сделал 4, но можно хоть 100) выбрал из этого пула 3392 рандомных тиража.
3. посчитал некоторые распределения и параметры получившихся выборок.
Распределение первых выпавших шариков.
Что что, а распределение первых выпавших шариков уж точно должно быть равномерным. Распределение вторых шариков зависит от распределения первых шариков и т.д. К тому же, если в течение многих лотерей убирали один и тот же шар, то мы должны наблюдать провал в вероятности выпадения этого шара. К тому же, есть некоторые числа, которые люди особо любят и считают счастливыми (хз, 7 предположим) или несчастливыми (типа, 13). Итак, что мы имеем:
Вроде есть пики, есть провалы. Может, действительно, нам врут. Но теперь сравним это с теми распределениями, в рандомности которых я уверен (сгенерированные мною). И:
Вот здесь уже сложно отличить (ну, здесь легко, потому что я сделал график столото синим, но вы поняли смысл). Отсюда делаем вывод: результаты лотерей столото находятся в пределах статистической погрешности и не противоречивы.
Доля тиражей с "тройками":
Аргументом @uncleHarry было то, что доля тиражей с "тройками" (то есть, в тираже присутствуют три подряд идущих шара, типа 3-4-5 или 5-3-4) в 3 раза выше, чем должна быть.
Внимание, вопрос (гонг): какое из этих чисел соответствует лотерее столото? (все остальные соответствуют случайно сгенерированным лотереям).
Готов поспорить, что процент правильных ответов на этот вопрос будет порядка 20% (если этот пост прочитает вообще хоть кто-то).
Правильный ответ - Г.
"Расстояния между шарами"
Еще один аргумент - то, что наиболее часто встречающееся расстояние между шарами равно нулю, хотя якобы должно быть 6.5 (в случае 6 из 45, в случае 5 из 36 - 6.2). Тут имеет место путаница понятий "наиболее часто встречаемое" и "среднее". Вот картинка для пояснения:
В оригинальном посте было посчитано среднее расстояние между шарами. Но и для столото среднее расстояние 6.5 (как и должно быть). Хорошо этот аргумент описан у @aapr, я лишь приведу еще одно сравнение:
Итого:
С точки зрения теорвера, у столото все чисто (пока). Я не особо эксперт в этой области, наверняка есть более продвинутые методы анализа данных лотереи, о которых я не знаю. Готов предоставить расчетники по запросу в комментах (там экселевские файлы).
Так или иначе, у лотереи существенно больше методов "обмана", чем вытаскивание шаров из пула. Они просто разыгрывают не все деньги, полученные с билетов (да, так делают все лотереи, но обычно маржа ~10%, а тут, судя по всему, ~50%). Банально и просто.
P.S. @aapr, респект!