Липовый факт
Представьте себе: Олег подкидывает монетку и получает сплошные решки. Сто решек подряд.
Это ему не везёт так жёстко? Или обычное дело?
Кажется, что-то не так с Олегом. Все нормальные люди на его месте решек с орлами бы получили примерно поровну. Так нам подсказывает интуиция. Да и наука статистика подтверждает: при большом количестве испытаний решек будет где-то так половина.
Значит ли это, что получение ста решек подряд - это что-то особенное? Что собой представляет статистический факт?
Я сейчас вижу так.
Комбинаторика и теория вероятностей - это детальное, как под лупой исследование большой омеги, она же - пространство состояний системы, она же - набор всех возможных исходов эксперимента.
Ну а статистика - это искусство составления агрегатных функций, что-нибудь усредняющих, принимающих много где одинаковые значения. Вариативность реальности при этом теряется. Но на замену приходит возможность охватить всё за раз. Данных становится меньше. Нет, сильно меньше.
Скажем, комбинаторно пространство состояний эксперимента "подбрасываем монетку сто раз" - это все возможные строки из сотни букв О и Р, в любом порядке.
Для двух подбрасываний это варианты ОО (два орла подряд), ОР (орёл потом решка), РО, РР. Для трёх - ООО, ООР, ОРО, ОРР, РОО, РОР, РРО, РРР.
С точки зрения теории вероятностей последовательность у Олега обычная, просто какое-то слово из сотни букв. У каждого такого слова индивидуальная вероятность микроскопическая. У всех отдельных слов она одинаковая.
Со статистической же точки зрения Олег сильно отклонился от среднего: у большинства наших слов поменьше решек, орлов побольше... А ну и что?
Мне всю дорогу казалось, что я туповата про все предметы, где надо как-то встречаться с реальностью. Математику понимаю, если считать математикой алгебру с геометрией, теорию чисел, что-то такое, где объект исследования - это идеальный объект.
Ну а статистика, думала я, мне не даётся из-за того, что изучает реальность.
Так и какую реальность изучает статистика с орлами-решками? Что много больше вариантов, где решек с орлами примерно поровну?
Это липовый факт. Ну то есть факт, конечно, но он замыливает детали, как и любая статистика.
Следите за руками: Олег подбрасывает монетку сто раз и получает некую там последовательность. Когда он её же получит снова?
Да никогда примерно, какой бы она ни была. Ведь шанс получения любой заранее данной последовательности примерно ноль.
Давайте чуть по-другому записывать результат. Вместо фиксации орлов и решек будем на каждом шаге независимо что-то загадывать. Дальше поставим 1, если монетка упала так, как загадано. Или поставим 0, если упала другой стороной.
Получим последовательность из нулей с единичками.
Что бы там ни загадывал наш Олег, сумма цифр в его результате будет в районе пятидесяти.
То есть, скорее всего, где-то так в половине шагов именно так монетка и ляжет, как он загадывал. А в остальной половине ляжет не так.
Надо ли настораживаться и сторониться Олега, если он получил семьдесят пять единиц? Если он угадал семьдесят пять положений монетки из ста? Гаусс подсказывает, что тут стоит задуматься.
Буду премного рада, если в каменты придут сограждане, которые статистику любят и чувствуют, и увидят они в рассуждениях моих лажу, и разнесут в пух и прах. Я просто этого жажду от всего сердца.
Ну потому что полжизни думать, что ты что-то не понимаешь проще, чем обнаружить, что где-то де-факто липа, и эта липа используется, чёрт возьми, например, в управлении, в медицинских исследованиях или в оценке IQ.
