Чтобы научиться читать или строить графики, полезно посмотреть на плохие варианты. Поэтому готовьтесь смотреть на подборку самых дурацких иллюстраций! Заодно научимся распознавать манипуляции и некорректные графики
Начнём с классики. Визуализация результатов вопроса ученикам старшей школы „В каком классе вы учитесь?“
Здесь плохо просто всё. Начиная с данных: на опрос как будто бы ответило 104% участников, продолжая выбором графика и его отображением: почему-то доли круга не пропорциональны числам, которые они должны отражать. Источник графика найти не удалось, но предположу, что были перепутаны числа, а круг разделён корректно. Ещё такие странные графики порой создаются автоматически экселем или гугл-таблицами, но этот явно пошёл в печать.
О выборе графика стоит поговорить подробнее. Пироговые диаграммы (pie charts) кажутся интутивными и часто употребляются в медиа, но значительно реже встречаются в науке. Причина в сложности их восприятия. Числа визуализируются как доли круга – чем больше число, тем больше угол или площадь сектора. Но люди довольно плохо интуитивно сравнивают углы. Попробуйте, глядя на графики сверху упорядочить проценты у себя в голове
Согласитесь, что со столбцами снизу, изображающими те же данные, это сделать гораздо проще
Однако даже столбчатые диаграммы можно превратить в нечитаемый ужас:
Здесь авторы хотели показать слишком многое, но в итоге испортили график, захламив его надписями. Есть хорошее правило: одна иллюстрация – одно сообщение. Оно не всегда реализуемо в научных статьях, где место ограничено, но хорошо соблюдать его хотя бы в презентациях. Мне очень нравится визуализация данных в крупных медиа об экономике: там очень хорошо соблюдают это правило (а может, и изобрели его)
Следующий пример – как даже неплохой график можно превратить в головоломку. Столбики визуализируют частоту цветов обуви
Но надписи не совпадают с цветами! Напоминает психологические эксперименты, в которых нужно читать слова „красный“, „зелёный“, „синий“, написанные другими цветами
Сделав корректные цвета, надписи можно убрать вообще. А также лучше всегда сортировать столбчатые диаграммы: это упростит их восприятие. Направление сортировки зависит от сообщения. Если хочется показать самые распространённые цвета обуви, лучше начинать с больших столбцов, а чтобы обратить внимание на непопулярные цвета – с маленьких
Например, как в этом графике средней высоты девушек по странам. Очевидно, для экранизации Атаки Титанов нужно побольше индианок в роли людей и немного девушек из Латвии, любящих ломать стены
Здесь оочень много проблем. Главная – вертикальная ось начинается не с нуля. Для столбчатой диаграммы это преступление, которое обычно совершается с целью манипуляции или по незнанию. Отсчёт не с нуля приводит к тому, что крошечные различия (здесь – в несколько дюймов) выглядят как изменения в несколько раз. Обычно нужно обращать на это внимание, чтобы не пропустить, но здесь авторы сами довели иллюстрацию до абсурда, заменив столбцы фигурками девушек. Это приводит к такому эффекту:
Использование картинок для изображения того, что визуализируешь – это хороший приём, но с ним нужно быть очень аккуратным. Особенно, если график отражает одно число, а картинка изменяется в двух измерениях. Наш мозг в таком случае сравнивает площади, а не высоту. Разница в 3 раза станет выглядеть, как разница в 9. Это часто используется в манипулятивных целях, когда нужно показать гигантские отличия там, где их нет:
Колоссальный отрыв в разы: целых полтора процента
Следующий пример – про то, как горе помогает путешествовать во времени. Если сильно хочется начать ось не с нуля, нужно показывать данные точками или, в случае непрерывной переменной по оси X – линией. Что-то похожее изображено на этом графике зависимости ответа на горе от времени. Строго говоря, это не визуализация данных, а инфографика – изображение идеи автора
Всё бы хорошо, вот только после снижения ответа на горе, происходит путешествие назад во времени, после которого ответ растёт. Потом этот день грустного сурка начинается заново. Тут нечего улучшить, кроме базового понимания, как работают графики
А здесь всё просто и честно: вот доверие, партнёрство, инновации и эффективность, а вот наши ценности. Даже немного пересекаются!
Это тоже не визуализация данных, а дурацкая иллюстрация по мотивам графиков. Но множества и правда можно изображать при помощи диаграммы Венна. Её можно построить не только для двух, но и для трёх (думаю, все видели подобные круги) и даже для четырёх множеств. Это очень сложный тип визуализации, который редко облегчает понимание данных.
Вот пример интересной диаграммы Венна из научной статьи о бананах. Это относительно неплохой вариант, но и на нём видно основную проблему такого типа графиков – их надо читать, чтобы сравнить данные. Основное преимущество визуализации – простота и скорость зрительного восприятия – теряется
Гораздо более читаемый вариант для изображения таких данных – UpSet plot. С его помощью можно показать гораздо больше множеств и значительно проще визуально сравнивать отличия в их размере.
Завершим подборку гораздо более тонким моментом, однако тоже обесценивающим график (и речь даже не о вырвиглазном дизайне). Здесь показан процент медицинских абортов в США по годам. Попробуйте сами понять, как искажена информация
С вертикальной осью всё в порядке и даже начало идёт от нуля, что позволяет визуально сравнивать, во сколько раз изменились данные. Но на этот раз проблема в горизонтальной оси: точки нанесены на одинаковом расстоянии друг от друга, будь между ними один год или в несколько лет. В целом, это не меняет посыл иллюстрации, но искажает скорость изменения показателя. Кажется, что после 2001 года скорость увеличения абортов увеличилась, но так как до следующей точки 4 года, она на самом деле была меньше, чем прирост с 2000 по 2001 год
В целом, всегда, когда вы видите график, проверяйте несколько вещей:
Подписанные оси. Если непонятно, что изображено на графике, смотреть на него нет никакого смысла
Корректные оси. Если ось начинается не с нуля, визуально размеры сравнить не получится – можно только увидеть тренд. Также важно проверять, чтобы с осями не происходило что-то странное: например, они могут быть перевёрнуты или с неправильными делениями, как на последнем примере
Данные имеют смысл. Например, проценты складываются до 100, а числа имеют разумные масштабы
Этого уже хватит, чтобы найти огромное количество ошибок и манипуляций. Надеюсь, получилось весело и полезно!
Мой телеграм канал о науке и образовании