Внимание! Это фишинговый сайт, не вводите в нем свои личные данные!

Наука

Эффект возвращения к среднему⁠⁠

2 года назад

Возвращение к среднему - это статистический эффект, описанный более 130 лет назад сэром Фрэ́нсисом Га́льтоном. Упрощенно его можно сформулировать так: если что-то получилось слишком хорошо, то при повторе получится хуже, а если слишком плохо, то при повторе будет лучше.

Это не какая-то философия жизни, а строгая статистическая закономерность, которую можно выразить математическими формулами, чего я тут делать не буду, а вот примеры, как это всё работает, приведу.

Классический пример - это пересдача экзаменов (тестов, контрольных работ).

Результат экзамена определяется не только знаниями, но и случайными факторами. Например, не знал студент один вопрос из сотни, и именно он ему и попался. Понятно, что при повторном экзамене нарваться еще раз на тот же вопрос шансов мало (если вопросы выдаются случайно). Потому результат будет лучше, даже если студент ничего дополнительно доучивать не станет.

Другой классический пример - рост детей и родителей.

Этот пример приводится в научной работе самого Га́льтона. Рост детей определяется не только ростом родителей, но и многими случайными факторами. Если родители имеют слишком высокий рост, то это значит, что не только наследственность у них такая, но и случайные факторы способствовали высокому росту. Второй раз, на их детях, случайности вряд ли так же хорошо сложатся. Так что в среднем дети очень высоких родителей будут чуть пониже родителей. И наоборот, дети родителей с ростом ниже среднего будут чуть выше родителей.

Ну и еще пример про тестирование медицинских препаратов.

Допустим, придумано лекарство “фуфломицин” от хронической болезни, скажем, псориаза. И нужно лечебный эффект подтвердить в клинических испытаниях.

Для испытаний обычно набираются больные, имеющие не самые легкие случаи, чтобы лечебный эффект было проще доказать.

Степень тяжести заболевания зависит от случайных факторов и варьируется со временем, то становится чуть лучше, то чуть хуже. Поэтому в группу на тестирование попадают больные, у которых в среднем тяжесть болезни легкая, но по случайности, в момент первого измерения, она оказалась хуже обычного.

Повторная оценка заболеваний этих людей покажет меньшую степень тяжести, просто потому, что во второй раз случайные факторы вряд ли так же сильно осложнят заболевание. За счет этих случаев мы получим положительный эффект в среднем по группе, даже если никакого лечебного препарата не будем применять.

Замечу, что это не плацебо-эффект, а статистический феномен. Точно так же мы получим положительный эффект на животных.

Если вам стал понятен принцип, то теперь вы сможете предсказать много чего интересного. Например, с точки зрения этого эффекта можно рассмотреть переезд в другой город, смену професии, повторный выход замуж...

Показать полностью 1

[моё] Статистика Научпоп

0

9

GitMalkavian

[моё] Статистика Сбор данных Ответ на пост

Продолжение поста «Статистика использования тега "Мигранты" на Пикабу»⁠⁠1

2 года назад

Ну вот я заморочился и за полчаса собрал данные используя возможности поиска Пикабу:

Продолжение поста «Статистика использования тега "Мигранты" на Пикабу»

Из графика видно, что достаточно долго количество постов с этим тегом колебалось в пределах 25-35 в месяц. В апреле 2021 начался рост (в ноябре какая то аномалия), который резко пошел на спад в марте 2022, когда повестка резко изменилась (интересно будет поискать, когда начались первые упоминания ЦИПсО), далее более менее ровная линия вплоть до июля 2023, и снова резкий рост. Выводы делайте сами.

8

GitMalkavian

Статистика Сбор данных Текст

Статистика использования тега "Мигранты" на Пикабу⁠⁠1

2 года назад

Уважаемые статистики, может кто нибудь подсказать, как собрать статистику по использованию на Пикабу тега "Мигрант" по месяцам, за несколько лет?

2

Экономика

Продолжение поста «Линейная регрессия рубля»⁠⁠1

[моё] Экономика Статистика Data Science Курс доллара Ответ на пост

2 года назад

На четыре дня раньше моего прогноза однако.

Двадцать три дня назад я предсказал, что 100 руб будет достигнуто в интервале с 7 по 14 октября. Использовал простую линейную регрессию по времени.

Показать полностью 1

12

Наука

Типичная ошибка ученых⁠⁠

[моё] Статистика Наука Биология Медицина

2 года назад

Начну издалека, но думаю так будет понятнее о чем я (если нет, то это про поправку на множественную проверку гипотез).

Тиктокер демонстрирует суперспособность: с завязанными глазами бросает мяч и попадает в кольцо. И это не видеомонтаж. Как такое может быть? Опытный пикабушник скажет: баян и жульничество! Он тысячу раз бросал мяч и не попадал, но один раз случайно у него получилось вот это он и показал.

Но этот тиктокер не так прост. У него есть абсолютно надежные доказательства, что все это он делал только один раз и забросить мяч у него получилось с первого раза! Да он даже мячик и кольцо видит первый раз в жизни! Он действительно обладает суперспособностью или тут где-то жульничество? Догадываетесь в чем дело? Тиктокер не повторял бросок тысячу раз, это правда. Вместо этого он сделал тысячу разных трюков, не повторяя их.

Кто-то может решить, что с этим очень просто разобраться – потребуем у тиктокера повторение трюка, вот сразу обман и выяснится! И в следующий раз нам приносят видео, где другой тиктокер подбрасывает монетку два раза и оба раза она падает на ребро. Никакого монтажа, никакого удаления неудачных попыток подбрасывания. Все так и произошло с первого раза.

Догадываетесь как это получилось? Он просто проделал по два раза подряд десять тысяч разных трюков!

Думаете это не имеет отношение к жизни!? Имеет! И подобное регулярно происходит в медико-биологических исследованиях.

Дело в том, что сейчас есть возможность быстро и дешево измерять множество параметров живого организма. Типичное измерение активности генов делается в течение нескольких дней, стоит около $100 и выдает данные об активности десятков тысяч генов.

Теперь вы понимаете, как легко можно провести исследование и “доказать”, что музыка Вивальди, например, влияет на активность генов в раковых клетках. Причем можно даже показать, что это влияние повторяется в нескольких экспериментах. Просто из десятков тысяч результатов отбираем нужное и публикуем!

Показать полностью

33

Цикличность и особенности Российской тошноты⁠⁠

[моё] Статистика Тошнота США Россия

2 года назад

Я сделал открытие. Тошнота имеет цикличность. Более того, пиковые значения Российской тошноты имеют свои особенности и не совпадают с Американской. Российская тошнота имеет два пика - январский и августовский, а Американская только один - в январе.

Тошнота в январе скорее всего связана с новогодними праздниками - отравление салатами и алкоголем. Но почему Российская тошнота имеет пик в августе? Созрели кабачки на дачах?

Методика

Проанализированы методом декомпозиции временные ряды поисковых запросов на google trend.

Анализ поисковых запросов слова "рвота" Российского сегмента интернета

Анализ поисковых запросов слова "vomit" Американского сегмента интернета

Показать полностью 3

8

Экономика

Линейная регрессия рубля⁠⁠1