8

Про проверку статистических гипотез с примером на котиках

Про проверку статистических гипотез с примером на котиках

На картинке показан принцип проверки статистических гипотез. Если гипотеза дает малую вероятность наблюдаемых событий (p < 0.05), то она отвергается и противоположная считается доказанной.

Почему это интересно? Потомучто абсолютно все современные научные исследования включают проверку статистических гипотез. Можно сказать, что проверка статистических гипотез - это глобальный фильтр, который защищает нас от лженаучных результатов.

Вообще проверку статистических гипотез можно применять к любым исследованиям. Вот пример на котиках (с расчетом в R).

Котик 7 раз поцарапал вас правой лапой и только 3 раза левой. “Это случайность или кот правша?” - задумались вы.  Решить этот вопрос поможет биномиальный тест.

Предполагаем, что кот - амбидекстр (обе лапы одинаковы) и перекос на правую лапу это случайность. Тогда вероятность получить правой лапой 7 и более раз из 10:

>binom.test(c(7, 3))

p-value = 0.3438

"p-value" получилось очень большое, поэтому с научной точки зрения ничего сказать нельзя. Может правша, а может и нет. 

Значит продолжаем злить кота, доведя количество обдираний до 30 (это количество можно оценить заранее, но это другая история).

Допустим в результате получилось, что 21 раз из 30 кот царапал правой лапой. Считаем p-value:

>binom.test(c(21, 9))

p-value = 0.04277

Вот этот результат научное сообщество уже принимает, как доказательство того, что котик правша.

Примерно так все и устроено в науке.

Но почему именно “0.05”? - Этого никто не знает. Вот так выбрали и все - традиция.

Эта традиция означает также, что 5% всех научных результатов ошибочны. Можно ли уменьшить число ошибочных результатов? - да можно. Например принимать только результаты с p-value < 0.01. При этом ошибочных результатов станет 1%, но увеличится сложность экспериментов и их стоимость. Нашему котику, например, придется вас царапать раз 50 и у него могут устать лапки.

Лига статистиков

29 постов82 подписчика

0
Автор поста оценил этот комментарий

"5% всех научных результатов ошибочны". Разве? А не то, что в случае этих 5% можно получить ложноположительный или ложноотрицательный результат.

И ещё " научное сообщество уже принимает, как доказательство". На самом деле принимает как вероятность того, что при повторении эксперимента или увеличении выборки результат в 95% случаев будет +- совпадать.

Неповторяемость данных часто связана с неправильным дизайном эксперимента, не учетом каких-то параметров (котик сломал ноготок на правой лапке и поэтому неделю царапался левой) и др.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
5% всех научных результатов ошибочны

Это я чушь написал, спасибо что заметили. Все конечно зависит от того, что идет на проверку. Если изначально все проверяемое - случайные отклонения, тогда 5% пройдет проверку, но после тестирования мы всеравно будем иметь 100% ошибочных результатов (случайные отклонения, принятые за закономерные).

Но давайте будем считать, что до проверки половина результатов - случайные отклонения, тогда после проверки получится примерно то, что я и написал изначально :)


И ещё " научное сообщество уже принимает, как доказательство". На самом деле принимает как вероятность того...

Как я и написал выше, все зависит от того, что изначально идет на проверку. Но конечно правильнее было бы тут написать "научные журналы принимают к публикации"

0
Автор поста оценил этот комментарий
Уровень значимости может выбираться не только 5%, а соответствующий "точности" и целям исследования. 5% удобны просто потому, что хорошо ложатся в картину мира людей, у которых все на свете - это нормальное распределение.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Строго говоря связи с нормальным распределением тут нет, а в моем примере вообще биномиальное распределение. НО (согласно википедии) традиция действительно пошла из-за нормального распределения. Фишер (основатель всей современной статистики) в 1925 году заметил, что в нормальном распределении 95% результатов лежит в границах двух сигм (точнее 1.96 сигмы). Поэтому он и предложил считать 5% в качестве границы возможного и невозможного.

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества