2410

Как лгать с помощью статистики

Статистика — мощный инструмент. В умелых руках она творит чудеса! Но с её помощью можно также легко обмануть людей. Какие приёмы маркетологи и ведущие новостей используют, чтобы ввести нас в заблуждение?

Начинать ось y не с нуля

Самый распространённый маркетинговый приём! Посмотрите на этот график пользователей твиттера:

Выглядит довольно здорово: последний столбик выше первого в 3 раза! Вот только отсчёт по оси y начинается не с 0, а со 100. Посмотрите на исправленный график:

Уже не так впечатляет, не правда ли? Видимо, твиттер в тот период нуждался в инвестициях

Вот ещё более впечатляющий пример. Chevrolet хвалится тем, сколько их внедорожников всё ещё работают, спустя 10 лет. Судя по графику, Nissan до них далеко: их столбик меньше раз в 10! Но если мы внимательно посмотрим на ось y

Она начинается с 95%! И исправленный график показывает всю абсурдность рекламы. Так ли страшны 3% за 10 лет?

Подобным грешат и политики:

Разница есть, но она сильно преувеличена

Иногда начинать отсчёт не с нуля — нормально

Как ни странно, солгать можно и с помощью обратного приёма. Если в графике есть какая-то временная зависимость, то есть мы хотим посмотреть изменение параметра за какой-то срок, гораздо информативнее будет начать отсчёт не с нуля! Иначе мы можем вообще не увидеть изменений. Так, например, выглядит мировой финансовый кризис, если показать полный график:

Очевидно, кризис — в головах! Но если посмотреть на график поближе, становится ясно, что что-то произошло:

Также имеет смысл брать не весь доступный временной отрезок, а лишь его актуальную часть. Приведу пример со статистики своей группы. Если смотреть на график подписчиков, явно видно, когда выходили посты и насколько они были успешны:

Но если я включу во временной отрезок самый успешный пост, его величина сведёт эти колебания на нет!

Если вы хотите показать, насколько ваша страна богата, просто покажите график среднего дохода, который начинается в 14 веке. Рост будет невероятный!

Неподходящие графики

Люди изобрели целую кучу графиков! Гистограммы, круговые диаграммы, ящики с усами (да-да, и такое есть). Какой использовать для визуализации данных?


Зависит от того, чего вы хотите добиться. Например, такой график позволит людям легко понять соотношение данных:

А такой график во-первых, покажет ваши специфические вкусы, а во-вторых, запутает людей:

Из-за наклона соотношения площадей искажаются. Информация (та же самая, что на графике выше) воспринимается гораздо хуже. Можно довести график до абсурда, наклонив его ещё сильнее и повернув, скажем, зелёной стороной. Будут ли тогда вообще видны остальные части?


Используйте графики правильно:

Надеюсь, теперь вы не попадётесь на самые банальные уловки маркетологов. Вот вам напоследок шедевральная диаграмма Венна с использованием банана:

Лига образования

7.1K постов23K подписчиков

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:


ДЛЯ АВТОРОВ:


Приветствуются:

-уважение к читателю и открытость

-желание учиться

Не рекомендуются:

-публикация недостоверной информации


ДЛЯ ЧИТАТЕЛЕЙ:


Приветствуются:

-конструктивные дискуссии на тему постов

Не рекомендуются:

-личные оскорбления и провокации

-неподкрепленные фактами утверждения


В этом сообществе мы все союзники - мы все хотим учиться! :)

104
Серый
Автор поста оценил этот комментарий

Хочу увидеть ящик с усами

раскрыть ветку (1)
89
Автор поста оценил этот комментарий

Вот :)

Иллюстрация к комментарию
показать ответы
30
Автор поста оценил этот комментарий

Как лгать с помощью статистики?

Хуйнуть первую диаграмму в цветах украинского флага.

раскрыть ветку (1)
79
Автор поста оценил этот комментарий
Иллюстрация к комментарию
234
Автор поста оценил этот комментарий
Заголовок тоже врёт. Т.к. в статье показано не как врет статистика, а как исказить статистические результаты "правильной" подачей материала.
раскрыть ветку (1)
102
Автор поста оценил этот комментарий

Статистика — математическая дисциплина и сама по себе не врёт. Врут интерпретаторы, неправильно её понимающие. Или понимающие правильно, но специально искажающие суть

Есть ещё куча материала для второго поста на ту же тему. Ложные корреляции, неверные выборки. Может быть, это будет больше похоже на то, как "врёт статистика" :)

показать ответы
3
Автор поста оценил этот комментарий

Объясните банан

раскрыть ветку (1)
12
Автор поста оценил этот комментарий

Диаграммы Венна — это вот такие штуки с пересечениями. Их очень непросто сделать для пересечений больше трёх так, чтобы сохранить читаемость. Авторы сделали диаграмму и читаемой, и нескучной, сделав 6 пересечений! Сама идея использования банана в диаграмме шикарна :D Причём, статья опубликована в Nature — очень серьёзном научном журнале. Статья про геном банана, собственно :)

Иллюстрация к комментарию
показать ответы
9
Автор поста оценил этот комментарий

В диаграммах какую-либо ось начинают не с 0, а с другого значения, когда общая часть величин вторична, и акцентируют внимание на дельте. И далеко не в целях маркетинга, а для рационализации использования пространства диаграммой и более наглядной аналитики. Вы или никогда не строили аналитические дэшборды или имеет зуб на Твиттер. Очень много бреда. Допускаю, что это может кто-то использовал лет 20 назад, но цель построения диаграмм явно не улавливаете.

раскрыть ветку (1)
24
Автор поста оценил этот комментарий

Шевролет, несомненно, хотели добиться именно рационализации использования пространства диаграммой :)

показать ответы
Автор поста оценил этот комментарий

-бла бла....Собянин...бла бла...

-Хорошая статья, а скажите, можно без Собянина?

-Да ты че, ради него все и писалось.

-Бадум-тссс!

-Во!

https://youtu.be/VlmMGEPsVus


Я так понимаю, выборы на носу? )

раскрыть ветку (1)
4
Автор поста оценил этот комментарий

Я из Казахстана. Не знаю, что там с выборами в Москве :)

показать ответы
0
Автор поста оценил этот комментарий

И самое главное -- не приводить погрешностей.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

А как вам такое? :)

Иллюстрация к комментарию
показать ответы
19
Автор поста оценил этот комментарий

А что с бананом то? Поясните пожалуйста.

раскрыть ветку (1)
6
Автор поста оценил этот комментарий

Использовать в диаграмме банан — очень неординарный приём :D Причём статья серьёзная: опубликована в Nature (топовый научный журнал). Диаграммы Венна вообще тонкая штука, легко сделать их абсолютно нечитаемыми. Тут авторы очень изящно сделали её и понятной, и нескучной

показать ответы
0
Автор поста оценил этот комментарий

А почему старший преподаватель голоден?

раскрыть ветку (1)
4
Автор поста оценил этот комментарий

Потому что в нашей стране либо преподаёшь, либо кушаешь

показать ответы
2
DELETED
Автор поста оценил этот комментарий

да что же за информация на графике с бананом-то?

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Если не ошибаюсь, там общие с другими видами участки генома (геном банана, собственно)

показать ответы
2
Автор поста оценил этот комментарий

Модераторы жестоко выпилили ссылку на группу из поста, хотя раньше проблем не было :/ Если интересны посты про науку и учёбу, заглядывайте https://vk.com/manoscience :)

0
Автор поста оценил этот комментарий
@Vladimir98, порекомендуйте пожалуйста хорошую книгу по статистике, чтобы было понятно, какой метод "подсчёта" и для чего использовать :) можно на английском если нет на русском перевода, справлюсь. Огромное спасибо заранее.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Для обзорного изучения рекомендую книгу "Статистика и котики" Владимира Савельева. Кроме шуток, объясняет великолепно. Для более подробного знакомства со статистикой и практического закрепления рекомендую вот этот курс: https://stepik.org/course/76/syllabus . Если же хочется суровую математическую статистику со всеми формулами и доказательствами, то есть учебник Гмурмана "Теория вероятностей и математическая статистика"

показать ответы
9
Автор поста оценил этот комментарий

вроде нет. По-моему, p=0.05 значит, что с вероятностью 95% нулевая гипотеза была отвергнута по делу, а с вероятностью 5% у нас просто были кривые данные, которые случайным образом дали нужный результат.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Не совсем так :) 5% — это вероятность получить такие данные (или ещё более странные) при условии, что нулевая гипотеза верна.

Например, применяем t-критерий на сравнение средних. Нулевая гипотеза — средние равны. P-уровень, скажем, 0.03. Это значит, что если средние на самом деле равны, вероятность получить такие данные, как у нас — 3%

Это не значит, что наши данные верны на 97%

Это не значит, что наша теория (средние различаются) верна с вероятностью 97%

Это вообще не значит, что наша теория верна! Но мы, по крайней мере, можем утверждать, что что-то нашли, так как случайно такие данные могли получиться маловероятно (3%)

А теперь самое забавное. Есть критерии, в которых нас интересует как раз-таки справедливость нулевой гипотезы. Например, критерий Шапиро-Уилка на нормальность. Нулевая гипотеза — величины распределены нормально. Как правило, нас это и интересует: мы хотим нормальное распределение! И если получить p<0.05 (возьмём для примера те же 3%), это будет значить, что при условии, что наши данные распределены нормально, мы могли бы получить такие данные в случайной выборке с вероятностью только 3%. Это значит, нулевую гипотезу можно отклонить и предположить, что распределение не нормальное!

В этом случае нас интересует p>0.05. Значительно больше! Но у неразбирающихся людей глаза лезут на лоб, когда они видят в докладе p=0.87 и гордо докладывающего это человека. Вот это забавно :)

15
Автор поста оценил этот комментарий
Иллюстрация к комментарию
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Это шикарно, сохранил

17
Автор поста оценил этот комментарий

Вот еще примерчик

Иллюстрация к комментарию
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Ну это уже совсем наглость. Причём величина дискретная, в принципе не может быть дробной

показать ответы
3
Автор поста оценил этот комментарий

Абсолютно не согласна с автором. Например, если брать показатель насыщенности артериальной крови кислородом (сатурация), который часто используют у больных с патологиями дыхательной системы то получится, что 95%-100% это норма, 94% - это гипоксия, а начиная от 90% и ниже уже нужны реанимационные мероприятия. На графике если ось  Y начать с 0, то будет выглядеть все очень даже незначительно.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Главное — это понимать, что хочешь показать и визуализировать это правильно. В посте примеры того, как люди понимают, как работать с информацией, но намеренно искажают её визуализацию, чтобы донести выгодную им мысль

0
Автор поста оценил этот комментарий

Ну на самом деле такое бывает, главное правильно трактовать. Обычно в моей области такое воспринимают как верхнюю границу.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Погрешность больше 100% с уходом в отрицательный вес? Это пример очень некачественной статистической обработки

показать ответы
Автор поста оценил этот комментарий

А лучше всего читать про графики в парке Горокого, там сейчас такое благоустройство собянин сделал, абалдеть можно!

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Эээ, это реклама?

0
Автор поста оценил этот комментарий

Мать работает в Росстате много лет.

Когда слышу "по данным Росстата", то начинаю ржать, зная кухню изнутри :)

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Расскажи, тоже интересно :)

0
Автор поста оценил этот комментарий

увы на слух тяжело, а так с субтитрами пробовал, как уткнусь в них и ничего не вижу более в итоге несколько серий так только осилил :С

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Попробуй начать с чего-нибудь попроще. Мультики, разговорные видео на ютуб. Что-то, что самому интересно смотреть так, чтобы не через силу. Если так смотреть что-нибудь на английском ежедневно, год пролетает незаметно и, оглядываясь назад, понимаешь, насколько же далеко продвинулся. И это смотря мультики! Я так и выучил язык :) Если интересно, могу пост написать

Для начала рекомендую милый мультик We bare bears. Есть вконтакте с русскими и английскими субтитрами

2
Автор поста оценил этот комментарий
тут вступает в силу, недопанимание, одинаковые "названия" в разных дисциплинах, и неправльное использование терминологии.

формально исследование должно строиться на "нулевой гипотезе" -условно "водка не вызывает опьянения". фактически же исследование строится на том, чтобы доказать что водка вызывает опьянение. отсюда подмена нулевой гипотизы, нарушение условий экспиремента, неверное применение статистики... в результате открытие

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Это немного не так работает. Вы собираете данные, применяете к ним какой-либо критерий и для него ищете p-уровень значимости. Критерий может, например, проверять данные на нормальность, сравнивать средние или смотреть вклад дисперсии групп в общую дисперсию. В критериях всегда присутствует нулевая гипотеза, которую нужно понимать. Какую угодно придумать не получится. Все проблемы в интерпретации полученных данных

1
Автор поста оценил этот комментарий

Шутка строится на многозначности слов:


pie - пирог/круговая диаграмма

bar - батончик/столбчатая диаграмма


Отсюда и весь каламбур.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Bar здесь — это всё-таки бар :)

показать ответы
1
Автор поста оценил этот комментарий
Покажите пожалуйста график с усами. Я не усну ведь теперь
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Вот, выше уже был в комментариях. Эти линии и называют усами :)

Иллюстрация к комментарию
0
Автор поста оценил этот комментарий

Прочитав надписи к фото, где Маршалл показывает диаграммы я понял всю соль шутки той сцены, в русской озвучки такого каламбура естественно нет))

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

В этом сериале столько чудесных игр слов! Все мы любим Кураж бамбей, но очень рекомендую пересмотреть как-нибудь сериал в оригинале

показать ответы
2
Автор поста оценил этот комментарий

Мог бы взять ночную подработку, скажем в клубе, и перейти в категорию Бэтменов.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Наоборот, он так откатится до студента-инженера. Тут дело тонкое

показать ответы
72
DELETED
Автор поста оценил этот комментарий

Врет не статистика, а люди которые ее интерпретируют.

Причем не обязательно осознано.

Это может просто быть ошибочный сбор данных. Собирали про зайчиков, а на самом деле собрали про кроликов, а результаты обработали как по выработке меха.


Вообще надо с умом подходить к графикам всяким. А лучше не подходить если оно вам не надо)

Надо помнить, что статистика это наука. А занимаются ей часто люди не с научным складом ума.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Учёные её тоже повсеместно используют и далеко не все хорошо понимают. Спросите у 20 учёных, что такое p-value, который есть в каждой их статье — получите 20 разных ответов

показать ответы
8
Автор поста оценил этот комментарий

@moderator, рекламные ссылки в тексте поста разрешены?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Раньше проблем не было :) Но если это противоречит правилам, не буду ставить

показать ответы
3
Автор поста оценил этот комментарий
Тут у вас с твитером проблемы, так как цифры в обоих графиках взяты разные
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Почему? Суть та же, просто на исправленном подписаны не конкретные месяцы, а квартили. Март — суть первый квартиль, 1/4 года :) И во втором сентября не хватает, да

показать ответы
0
DELETED
Автор поста оценил этот комментарий
Пардон, но это "как лгать с помощью графиков", а не с помощью статистики.
раскрыть ветку (1)
Автор поста оценил этот комментарий

Будет второй пост, может быть он будет ближе к этому заголовку :) Но как с помощью самой статистики можно врать, честно, не понимаю. Это математическая дисциплина, врать с её помощью не проще, чем с матанализом. Но при интерпретации результатов ошибок или намеренных искажений — масса, да

Автор поста оценил этот комментарий
Автор желтушник какой-то. Заголовок и текст статьи о разном вообще.
раскрыть ветку (1)
Автор поста оценил этот комментарий

Те, кто хотел бы лгать с помощью статистики, тоже нашли бы для себя всё нужное :)

0
DELETED
Автор поста оценил этот комментарий

Площади областей совсем не соответствуют цифровым значениям. Разве это не тот же обман что и в первых трех примерах?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Если в диаграмме Венна площади делать соответствующими цифрам, может получиться ОЧЕНЬ плохо. Поэтому, хорошим тоном считается поступать так. Учёные более придирчивые люди, чем покупатели, и разберутся :)

7
Автор поста оценил этот комментарий

Вы меня расстроили. Сначала примеры на пальцах, про которые ты, если сам не знал, то и без пояснений догадался бы, а в конце бахнули что-то непонятное и не известное простому обывателю.

Напоминает бородатые шутки про обучение программированию "Это винтик, его закручивают, это болтик, им скрепляют. Задание: постройте синхрофазотрон" (вольный пересказ, понятия не имею, чем отличается винтик от болтика:) )

раскрыть ветку (1)
Автор поста оценил этот комментарий

Мне просто очень понравилась эта диаграмма и я не знал, куда её впихнуть :)

показать ответы

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества