При чём тут ложь и наглая ложь? Явление ложной корреляции известно давно, равно как и методы его нейтрализации. Вот если бы недобросовестный статистик стал бы утверждать, что разводятся люди из-за маргарина, тогда это, действительно, была бы ложь.
Я как раз статистик. Тут была история в институте...
Был у нас на 4-м такой предмет: математические методы в экономике. Предмет, надо сказать, бесполезный. Большую часть формул, которым нас хотели научить мы прошли на 2-м курсе на Общей Теории Статистики.
Препод был не экономист, а математик с кафедры высшей математики. Математику он знал очень хорошо (естественно) но пытался нам приводить экономические примеры (из головы). Как приведёт - хоть стой, хоть падай.
Теперь я разъясню значение двух терминов.
Корреляция - показатель, характеризующий взаимосвязь между 2-мя явлениями. Может быть от -1 до 1. Если явления жёстко связаны, корреляция = 1. Если связи нет = 0. Если связь обратная - корреляция отрицательная.
Динамические ряды - таблицы, показывающие изменение какого-то показателя во времени. Например рост населения города по годам, удой молока на ферме по дням.
И вот стал он нам рассказывать что такое корреляция. Нам, прошедшим её на 2-м курсе и вычислявшим её по нескольку раз на дню. А есть одно правило, которое он, математик, знать не мог. Динамические ряды нельзя коррелировать напрямую. Сначала надо выравнять их по тренду, потом посчитать отклонения от тренда, в общем есть методика, очень красивая, между прочим. Но откуда неэкономисту было это знать? И он для примера взял именно динамические ряды, разумеется им придуманные из головы.
Я поднял руку и сказал, что так делать нельзя. Он не поверил. Я взялся доказать. Тогда он пообещал, если я докажу, поставить мне зачёт автоматом.
Пришёл я домой, взял статистический сборник "Народное хозяйство СССР" и наобум открыл 3 таблицы, данные которых заведомо не могли быть связаны. Не помню уж, что там было. Ну, например, производство металлорежущих станков, удойность коров и население Ашхабада. Посчитал корреляцию напрямую (как учил препод). Сам был поражён результатами. Я думал, будет 0,7-0,8. А у меня получилось 0,993; 0,995 и 0,997. Вот такая тесная связь! Принёс наутро преподавателю. Он пересчитал и вынужден был поставить мне зачёт.
Alex, а нестатистику можете объяснить на пальцах: 1) Как, взяв наобум заведомо несвязанные ряды, можно получить почти 100% корелляцию? 2) Почему временные ряды нельзя сопоставлять напрямую?
При чём тут ложь и наглая ложь? Явление ложной корреляции известно давно, равно как и методы его нейтрализации. Вот если бы недобросовестный статистик стал бы утверждать, что разводятся люди из-за маргарина, тогда это, действительно, была бы ложь.
Я как раз статистик. Тут была история в институте...
Был у нас на 4-м такой предмет: математические методы в экономике. Предмет, надо сказать, бесполезный. Большую часть формул, которым нас хотели научить мы прошли на 2-м курсе на Общей Теории Статистики.
Препод был не экономист, а математик с кафедры высшей математики. Математику он знал очень хорошо (естественно) но пытался нам приводить экономические примеры (из головы). Как приведёт - хоть стой, хоть падай.
Теперь я разъясню значение двух терминов.
Корреляция - показатель, характеризующий взаимосвязь между 2-мя явлениями. Может быть от -1 до 1. Если явления жёстко связаны, корреляция = 1. Если связи нет = 0. Если связь обратная - корреляция отрицательная.
Динамические ряды - таблицы, показывающие изменение какого-то показателя во времени. Например рост населения города по годам, удой молока на ферме по дням.
И вот стал он нам рассказывать что такое корреляция. Нам, прошедшим её на 2-м курсе и вычислявшим её по нескольку раз на дню. А есть одно правило, которое он, математик, знать не мог. Динамические ряды нельзя коррелировать напрямую. Сначала надо выравнять их по тренду, потом посчитать отклонения от тренда, в общем есть методика, очень красивая, между прочим. Но откуда неэкономисту было это знать? И он для примера взял именно динамические ряды, разумеется им придуманные из головы.
Я поднял руку и сказал, что так делать нельзя. Он не поверил. Я взялся доказать. Тогда он пообещал, если я докажу, поставить мне зачёт автоматом.
Пришёл я домой, взял статистический сборник "Народное хозяйство СССР" и наобум открыл 3 таблицы, данные которых заведомо не могли быть связаны. Не помню уж, что там было. Ну, например, производство металлорежущих станков, удойность коров и население Ашхабада. Посчитал корреляцию напрямую (как учил препод). Сам был поражён результатами. Я думал, будет 0,7-0,8. А у меня получилось 0,993; 0,995 и 0,997. Вот такая тесная связь! Принёс наутро преподавателю. Он пересчитал и вынужден был поставить мне зачёт.
Alex, а нестатистику можете объяснить на пальцах: 1) Как, взяв наобум заведомо несвязанные ряды, можно получить почти 100% корелляцию? 2) Почему временные ряды нельзя сопоставлять напрямую?