7

2. Закономерности, которых нет

Иллюзия кластеризации – тенденция видеть закономерности там, где их на самом деле нет. 👀

Нашему мозгу гораздо комфортнее, когда есть четкие закономерности:
🔸Не суй пальцы в розетку – убьёт.
🔸Занимайся физкультурой – будешь чувствовать себя лучше.
🔸Если блеснула молния – значит скоро будет гром.

Закономерностями мы облегчаем нагрузку на мышление, не надо каждый раз выстраивать длинные умозаключения почему будет именно так.

Но такая удобная функция может сыграть и против нас. Например, вы опросили 10 своих друзей (8 парней и 2 девушки), понравился ли им новый фильм, если он понравился всем кроме 2 девушек, то можно прийти к выводу, что:
🔸Фильм не понравится почти всем девушкам.
🔸Фильм не понравится 20% зрителей.

Иллюзия вызвана склонностью недооценивать степень изменчивости, когда у нас мало данных. Статистика может очень сильно измениться, если вы опросите 1000 человек.

В сфере фондовых рынков аналогично примеров тоже много:
🔸В среднем падение акций в кризис длится 1-2 года.
🔸В мае обычно рынки падают, а осенью растут.
🔸Цена акций Apple Inc (AAPL) растет после ежегодной презентации новых устройств.

❓Достаточно ли было финансовых кризисов и презентаций Apple для надежной статистики? За время наблюдений ничего не поменялось, данные однородны?

👉 Есть ряд цифр: «2, 4, 6», каким будет следующее число? Мы быстро находим закономерность – это арифметическая прогрессия. Но эти три числа вполне могут оказаться просто случайными, а мы уже посчитали результат на 3 позиции вперед.

Иллюзорная корреляция – явление, обнаружения тесной связи между рядами значений, в то время, когда в реальности связи нет или она гораздо слабее. Такая корреляция может быть обнаружена где угодно, а причина все та же – в нашем распоряжении недостаточно данных.

👉 В течение 15 месяцев проводилось исследование, где записывались симптомы пациентов с артритом и погодные условия. Почти все пациенты сообщили, что их боли связаны с погодными условиями, хотя реальная корреляция была равна нулю.

❗Люди соединяют события как сопутствующие друг другу – боль и плохую погоду, но мало обращают внимание на комбинации боль – хорошая погода и плохая погода без боли.

Где-то рядом существует ложная зависимость. Это тот случай, когда обнаруживается тесная зависимость вследствие совпадения или из-за наличия общего определяющего фактора. Тут данных уже достаточно.

👉 Известный пример ложной зависимости – это взаимосвязь продаж мороженного и количество утопленников. Выше продажи – больше утонувших и наоборот. Это не значит, что переменные влияют друг на друга. Запрет продаж мороженного не спасет ни одного человека. У этих рядов данных есть сторонний общий фактор – погодные условия (жара).

Посмотрите как отлично коррелируют индекс S&P500 и bitcoin.

2. Закономерности, которых нет Инвестиции, Фондовый рынок, Психология, Финансы

Вывод. Нужно быть осторожным, если используете не надежные закономерности, построенные на малом количестве данных. А также выяснять причины зависимостей.

Лига Инвесторов

11.8K поста8K подписчиков

Правила сообщества

1. Необходимо соблюдать правила Пикабу

2. Запрещены посты, не относящиеся к тематике сообщества

3. Запрещается откровенная реклама

4. Нельзя оскорблять участников сообщества.

Вы смотрите срез комментариев. Показать все
0
Автор поста оценил этот комментарий

А к чему пример Bitcoin и S&P500? Оба ряда можно скачать и посчитать между ними корреляцию. На глаз она не такая уж и большая?

раскрыть ветку (7)
0
Автор поста оценил этот комментарий

Можно посчитать, только вопрос: а зачем ее вообще считать?
Пост как раз про это. Можно брать разный стартовые точки и получать разные значения, в том числе очень хорошую корреляцию. Только с большой долей вероятности, на оба ряда влияют сторонние факторы, поэтому корреляция Bitcoin и S&P500 бесполезная

раскрыть ветку (6)
0
Автор поста оценил этот комментарий

Я посчитал. За выбранный вами на графике промежуток данных она равна 0.8386096. Польза от этого в том, что если мы не могли бы измерить сторонние факторы, влияющие и на то и на другое, мы всё равно сможем по значению одного показателя прикинуть значение другого. На этом построено всё машинное обучение.

Сторонние факторы, влияющие на оба показателя вполне понятны. Их всех можно охарактеризовать термином "общее состояние экономики".

Т.е. приводить S&P500 и Bitcoin в качестве примера "ложной корреляции" некорректно. Да и в целом термин "ложная корреляция" скорее вводит в заблуждение, т.к. даже "истинная корреляция" не является гарантией причинно-следственной связи.

раскрыть ветку (5)
0
Автор поста оценил этот комментарий

Корреляция это показатель связности величин. В данном случае, S&P500 и Bitcoin не зависят друг от друга, поэтому это ложная корреляция. Если завтра биткоин по своим причинам упадет к 0, S&P500 за ним не последует.
А рисковать деньгами по соображениям, основанным на ложной зависимости, так себе идея)

раскрыть ветку (4)
0
Автор поста оценил этот комментарий

И всё же я призываю не путать spurious correlation (число фильмов с Никласом Кейджем и кол-во утопленников в бассейнах) и корреляцию, в которой есть confounder variable -- в нашем случае "общеэкономическая ситуация". Если завтра биткойн упадёт к нулю, значит в экономике куда-то перетечёт полтриллиона долларов. Этим "куда-то" в том числе будут акции S&P500.

Если 10 лет назад у Биткойна ещё могли быть какие-то "свои" причины не связанные с институционалами, чтобы никак не повлиять на традиционные финансы, то сейчас это не так, т.к. им (инстиуционалам) принадлежит по разным сведениям от 6 до 8% всего битка.

Ну и да, в последний раз такие суммы "падали к нулю" в 2007 году с крахом Lehmann Brothers (0.6 триллиона долларов капитализации). Последствия были заметны всем.

Так что примеру с Bitcoin и S&P 500 не место в статье про закономерности, которых нет.

раскрыть ветку (3)
0
Автор поста оценил этот комментарий

Вы не правы. S&P500 и Bitcoin не зависят друг от друга, поэтому это ложная корреляция.
Если переменные влияют друг на друга, то можно говорить о зависимости. Если они ходят параллельно из-за 3й величины- это ложная зависимость, потому что выглядит, как будто бы переменные влияют напрямую друг на друга.

Напрямую зависят скорость движения и тормозной путь. А если вы кормите 2 собак, то сытость 1й не влияет на сытость 2й (это параллельные процессы, которые зависят от 3го фактора - кормящего). И если вы забыли покормить 1 из собак, то 2я будет по-прежнему сытая (допустим, что они в разных местах живут).

Как вы верно заметили, на корреляцию S&P500 и Bitcoin влияет общеэкономическая ситуация, поэтому они ходят +/- параллельно. Но напрямую они друг на друга не влияют.

Какие-то экстраординарные события в 1м из инструментов могут повлиять на 2й, но это будет разовое влияние. Причем, в приведенных примерах, взаимное влияние будет обратнопропорциональное:
Bitcoin => 0, то часть денег попадет в S&P500 или
Bitcoin => в космос, часть денег из S&P500 захочет поучаствовать в полете.

раскрыть ветку (2)
0
Автор поста оценил этот комментарий

> S&P500 и Bitcoin не зависят друг от друга
C недавних пор зависят. Если полтриллиона долларов в биткойне превратятся в 0, то они по-любому куда-то перетекут. В том числе и в акции S&P500.
> Напрямую зависят скорость движения и тормозной путь
Это функциональная зависимость (физика), а не корреляция (статистика).

Вы путаете корреляцию как свидетельство причинно-следственной связи (естественно, недостаточное самое по себе) и корреляцию как 2 числа, которые статистически друг с другом связаны, что позволяет по значению одного из чисел прикинуть значение другого.

Я не утверждаю, что цена биткойна напрямую влияет на S&P500. Я говорю, что они обе зависят от общего состояния экономики, которая для них является confounder variable по типу "The Fork" (в терминологии Causal Inference). Зная это можно спокойно построить и использовать inference model из этих 3х переменных. И это не будет "зависимостью которой нет" и прочей "ложной" корреляцией.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

я понял где собака зарыта) - мы говорим немного о разных вещах.
Я пишу исходя из контекста рассмотрения когнитивных искажений, где корреляция воспринимается людьми часто как прямая зависимость величин. Поэтому из-за неверного понимания могут быть сделаны ложные выводы.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку