Однако основная проблема лепестковой диаграммы даже не в плохом считывании. Дело в том, что этот график акцентирует внимание на фигурах, образованных линиями. Но эти фигуры не несут в себе никакого посыла. В отличие от линейного графика здесь нет непрерывной шкалы времени, порядок категорий обычно случаен. Если поменять этот порядок, формы фигур полностью изменятся.

Это приводит нас к выводу: соединять линиями значения категориальных переменных не стоит. Лучше соединять линиями только значения непрерывных числовых шкал.

Возьмем для примера датасет с рейтингом городов:

Попробуем сделать лепестковую диаграмму:

Скорее всего, мы сможем считать какой-то основной паттерн, но более тонкие различия – нет. Особенно сложно становится читать лепестковую диаграмму, когда на ней представлено больше одного ряда данных. Некоторые пытаются сделать лепестковую диаграмму для каждой категории. Это крайне неэкономно в плане использования пространства, хотя и лучше предыдущего варианта. Но по-прежнему ненаглядно:

Лепестковую диаграмму лучше всего заменить либо тепловой картой, либо рядами линейчатых диаграмм. На примере тепловая карта. Города ранжированы по суммарному рейтингу, от большего к меньшему:

Визуализация, составленная из рядов линейчатых диаграмм:

Для каждого критерия добавлена линия, соответствующая среднему значению по каждому критерию. Столбики раскрашены по принципу больше среднего/меньше среднего по каждому критерию. Это позволяет быстро просматривать каждый город и понимать, в чем он лучше и хуже других и в какой степени.

При использовании подобных диаграмм в презентациях будет требоваться акцентное выделение. Оно поможет донести ваше сообщение. Дело в том, что эти графики предназначены скорее для самостоятельного изучения, чем для представления результатов.

<p>Что делать, если график выглядит перегруженным. Боремся с лапшой</p>

Даже самый понятный тип визуализации данных можно сделать запутанным, добавляя все больше новых рядов данных. Если бесконтрольно увеличивать количество данных на линейном графике, получится «лапша».

Самые частые причины перегруженности:

• Попытка разместить слишком много данных в одном графике

• Неверно выбранный вид визуализации

• Попытка подписать все значения прямо на графике

Что можно сделать?

• Попробовать подобрать более подходящий вид визуализации

• Разделить данные на несколько графиков

• Попробовать сгруппировать часть данных, тем самым уменьшив их количество или улучшив организацию и читаемость. Обычно читаемость повышает создание категории «Прочее»

• Убрать часть данных

• Убрать подписи значений с графика

Вот пример перегруженного графика. Если разделить его на несколько, он становится читабельным и понятным:

А вот пример уменьшения хаоса и добавления читаемости с помощью изменения вида визуализации, группировки значений и избавления от подписей значений:

Сюда черточками можно нанести и сам индекс счастья, но и в таком виде визуализация достаточно наглядна.

– Но будьте осторожны, упрощая и группируя, – говорит Нейтан Яу. В информации могут скрываться важные детали. Нужно понимать задачу, соблюдать баланс и стремиться к объективности.

Если линейный график перегружен, обычно работает только две стратегии:

1. Использование серого цвета для основной массы линий. Эти линии мы оставляем для сохранения контекста или фона. Далее делаем акцент на нескольких, о которых идет речь в нашем сообщении:

В этом случае мы сохраняем общий паттерн снижения уровня безработицы по всем регионам. При этом мы отчетливо видим пик – последствия кризиса 2008 года. И, наконец, делаем акцент на лидере и аутсайдере в 2018 году.

2. Разбить данные на несколько мини-графиков. Важно, что все они должны быть в одной размерности для того, чтобы сохранить адекватность сравнения между ними.

Вот прекрасный пример от Нью-Йорк Таймс об эффективности различных методов контрацепции:

Если вам важно сохранить наглядный показ всех данных, но вы не хотите превращать график в лапшу, серии мини-графиков – практически единственный адекватный вариант визуализации.

<p>Еще раз об алгоритме выбора графиков</p>

Итак, выбор типа и конкретного вида визуализации данных – ключевой этап в донесении вашего сообщения графически. Для этого нужно качественно провести анализ данных. Затем получить информацию от экспертов о том, как именно следует интерпретировать эти данные. По результатам этого процесса вы сформулируете несколько сообщений, которые хотите донести. Я рекомендую отталкиваться от представленного ранее списка объединенных в группы видов визуализации. В 80 % случаев эффективно работает первый вид визуализации в каждой группе. Когда ваше сообщение попадает сразу в несколько категорий, важно понять, какой вид взаимоотношений между данными как вывод наиболее важен.

Перейти на страницу:

Похожие книги