51

Ложные корреляции

Ложные корреляции
9
Автор поста оценил этот комментарий

При чём тут ложь и наглая ложь? Явление ложной корреляции известно давно, равно как и методы его нейтрализации. Вот если бы недобросовестный статистик стал бы утверждать, что разводятся люди из-за маргарина, тогда это, действительно, была бы ложь.


Я как раз  статистик. Тут была история в институте...

Был у нас на 4-м такой предмет: математические методы в экономике. Предмет, надо сказать, бесполезный. Большую часть формул, которым нас хотели научить мы прошли на 2-м курсе на Общей Теории Статистики.

Препод был не экономист, а математик с кафедры высшей математики. Математику он знал очень хорошо (естественно) но пытался нам приводить экономические примеры (из головы). Как приведёт - хоть стой, хоть падай.

Теперь я разъясню значение двух терминов.

Корреляция - показатель, характеризующий взаимосвязь между 2-мя явлениями. Может быть от -1 до 1. Если явления жёстко связаны, корреляция = 1. Если связи нет = 0. Если связь обратная - корреляция отрицательная.

Динамические ряды - таблицы, показывающие изменение какого-то показателя во времени. Например рост населения города по годам, удой молока на ферме по дням.

И вот стал он нам рассказывать что такое корреляция. Нам, прошедшим её на 2-м курсе и вычислявшим её по нескольку раз на дню. А есть одно правило, которое он, математик, знать не мог. Динамические ряды нельзя коррелировать напрямую. Сначала надо выравнять их по тренду, потом посчитать отклонения от тренда, в общем есть методика, очень красивая, между прочим. Но откуда неэкономисту было это знать? И он для примера взял именно динамические ряды, разумеется им придуманные из головы.

Я поднял руку и сказал, что так делать нельзя. Он не поверил. Я взялся доказать. Тогда он пообещал, если я докажу, поставить мне зачёт автоматом.

Пришёл я домой, взял статистический сборник "Народное хозяйство СССР" и наобум открыл 3 таблицы, данные которых заведомо не могли быть связаны. Не помню уж, что там было. Ну, например, производство металлорежущих станков, удойность коров и население Ашхабада. Посчитал корреляцию напрямую (как учил препод). Сам был поражён результатами. Я думал, будет 0,7-0,8. А у меня получилось 0,993; 0,995 и 0,997. Вот такая тесная связь! Принёс наутро преподавателю. Он пересчитал и вынужден был поставить мне зачёт.

раскрыть ветку
4
Автор поста оценил этот комментарий
Хмм... это все как то связано
0
Автор поста оценил этот комментарий

Alex, а  нестатистику можете объяснить на пальцах: 1) Как,  взяв наобум заведомо несвязанные ряды, можно  получить почти 100% корелляцию? 2) Почему временные ряды нельзя сопоставлять напрямую?

раскрыть ветку
Автор поста оценил этот комментарий
"забавные примеры ложных статистических корреляций" - какое-то сочетание несочетаемого в одном предложении)
раскрыть ветку

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества