С чего начать, когда берешься за визуализацию? Как собрать понятную презентацию? Как разобраться в облаке диаграмм и графиков? Куда идет инфографика? Кто об этом говорит и как? Все, что вы хотели знать об инфографике, но не знали, у кого спросить. А может, у вас есть хороший совет? Присылайте — опубликуем!
Экономист, специалист по визуализации данных и презентациям Jon Schwabish поделился краткой памяткой по работе с визуализацией данных. Начнем знакомство с первых четырех принципов.
Люди смотрят на графики в отчетах, статьях, блогах, чтобы понять историю, которая за ними стоит. Данные — основа графика, и они должны быть на нем указаны. Но это не значит, что нужно разместить на графике сразу все имеющиеся у вас данные. Многие графики черезчур перегружены.
Ненужные и отвлекающие визуальные элементы сокращают эффективность визуализации. Визуальный шум может быть в виде темных или тяжелых линий сетки, излишних отметок, лейблов, лишнего текста, иконок или картинок; декоративных теней и градиента, объема. На графиках слишком часто используют текстуры и градиенты.
Отчеты часто страдают “эффектом слайд-шоу” — автор рассказывает о графиках в теле текста. Более эффективная модель такая — графики дополняют текст и в то же время в них достаточно информации, чтобы прочитать их как нечто самостоятельное. Небольшой пример — легенда, поясняющая значение линии, столбика, точки, часто размещается далеко от самого графика (справа) или под ним. Интегрированная легенда, которая находится сразу под названием, прямо на графике или в конце линии, намного более доступна читателю.
Эффективная визуализация данных учитывает особенности восприятия информации мозгом (пре-обработку информации подсознанием). Наши глаза определяют ограниченное количество визуальных характеристик (таких как форма или контраст). Мы считываем несколько характеристик и достраиваем их в воображении до цельного образа. Предвнимательная обработка учитывает операции, которые мозг совершает до того, как читатель внимательно всмотрится в изображение. Другими словами, учитывает, что именно мы заметим сходу. Подробнее о законах воприятия и их применении читайте тут.
Источник информации: DataViz Cheatsheet by Jon Schwabish
Подбор цветов в инфографике — непростая задача. Тут как нигде в графическом дизайне важно, чтобы информация считывалась заданным, а не произвольным образом. Мысли «о красоте» в инфографике — последний этап, о котором стоит задуматься уже после того, как основная работа закончена.
С точки зрения функциональности, самый многогранный цвет — серый. Оставим за кадром рассуждения, о том является ли он цветом, и рассмотрим примеры.
В графике Моритца Стафанера (автора проекта Truth and Beauty) о соотношении продолжительности жизни и уровня рождаемости акцент сделан на паттернах, характерных для США и Вьетнама. Этот эффект достигается благодаря четкому разделению на цвет (зеленый, фиолетовый) и не-цвет (серый).
В bullet graph Стефана Фью три оттенка серого использованы, чтобы дать почву для интерпретации. Черная шкала — шкала количественных значений. А три оттенка серого отражают качественные уровни (хороший, плохой, средний) и помогают интерпретировать эти значения.
В научной иллюстрации Браена Кристи изображение сердца притягивает внимание благодаря цвету, а серая, напоминающая рентген грудная клетка отображает расположение сердца. Она не привлекает к себе излишнего внимания и не перегружает изображение.
В линейном графике Мартена Ламбрехта отражена история сезонного варьирования температуры. Использование серого дает тут сразу три преимущества.
В дэшборде Welovroi серый фон использован для визуальной организации информации. Он разделяет смысловые блоки без кричащих бэкграундов или отвлекающих внимание границ.
В интерактивной схеме энергетических потоков Кристиана Беренса и компании Рориф серый отображает опции, которые не выбранны в данный момент, сохраняя их видимость.
Серый — заместитель неизвестной информации. В проекте Bloomberg Billionaires лица людей, чей внешний вид неизвестен, отображены серыми силуэтами. Решение одновременно решает проблему визуализации и намекает на интригу — в миллионерах-затворниках, несомненно, есть что-то мистическое.
Перевод с англ. «Make Grey your best friend» by Andy Kirk
Этот пост — немного необычный. Это перевод поста Стивена Фью, гуру информационного дизайна и автора многих книг по визуализации. Он затронул очень важную тему, связанную с степенью «красоты» инфографики и графиков.
…далее идёт текст от лица Стивена:
В ответ на мой недавний пост про Tableau 8, в значительной степени критически настроенный в отношении новых диаграмм из кружков (packed bubble charts, полноценного достойного русского аналога пока нет — поэтому будем называть их так) и облаков из слов, Chad Skelton (Чад Скелтон) из The Vancouver Sun написал возражение (http://blogs.vancouversun.com/2013/03/21/in-defence-of-eye-candy-bling-and-tableau-8/). Он поддержал мою критику, но также и отметил, что иногда стоит использовать диаграммы из кружков для того чтобы представлять информацию общественности, например, в новостных публикациях, потому что «столбиковые диаграммы слишком скучны».
Скелтон предполагает, что существует градация, иерархичность «интереса» к различным графикам, возможно, основанная на форме и цветах которые используются для отображения данных. Но возможно ли поместить различные объекты, кодирующие данные, такие как прямоугольники (в столбиковых диаграммах), линии, отдельные точки данных (в точечных диаграммах), и круги (в пайчартах и диаграммах из кружков) на некоторую непрерывную линию — от скучности на одном конце, до яркой, соблазняющей глаз красоты на другом? Вспоминая начало 1980х годов, William Cleveland и Robert McGill предложили иерархию графических методов, основанную на эмпирических исследованиях, но их результаты работы были градацией считывабельности (иначе говоря, нашей возможности воспринимать информацию представленная графическими объектами легко и правильно). Полезность и применимость их градации была очевидна, так как наша возможность понимать информацию, содержащуюся в графиках, полностью завязана на наши возможности четко и аккуратно понимать атрибуты, закодированные простыми значениями (положение в пространстве, длины, площади, углы, наклоны, интенсивность цвета, и т.д.). Итак, возвращаясь к предложению Скелтона, существует ли иерархия интереса среди различных способов графического отображения информации, и если есть — то помогает ли она улучшить считывабельность?
Что есть противоположность «скучному», на что так напирает Скелтон? Он пишет:
Многие люди, которые создают визуализации данных — журналисты, НКО, правительственные организации — стараются изо всех сил привлечь внимание людей к своим данным в современном онлайн-мире, заполненном бесконечным количеством отвлекающих вещей. И когда вы пытаетесь привлечь чьё-то внимание, основенно если ваши данные — результат какого-то статистического среза — то дополнительная красота на графике способна сильно продлить «жизнь» визуализации.
Визуализация данных — не только способ представления данных. Визуализации часто являются «рекламными биллбордами» которые вам приходится делать, чтобы привлечь внимание людей к информации, которая на самом деле является первопричиной создания коммуникации.
В самом деле, качество визуального представления не имеет ничего общего с информацией, которая содержится в диаграмме. Наоборот, в случае заинтересованности, главный измеритель — это степень желания разглядывать диаграмму. Чем больше диаграмма привлекает глаз читателя — тем она более интересная. Тем не менее, бесполезно пытаться привлечь чьё-то внимание, если привлекать внимание не к чему. Я не вижу проблемы в том, что диаграммы из кружков привлекают внимание, они беспокоят меня потому что как только они захватывают внимание — с этого момента они не дают никакой дополнительной информации. Подобная диаграмма похожа на ребенка который кричит «посмотри на меня, посмотри н меня», но просто стоит с грустным выражением лица. Пока вы не полюбите ребёнка, подобное ощущение — лишь полное расстройство.
Аргументация, согласно которой диаграмма должна содержать определённую степень красоты для того, чтобы привлечь внимание читателя, даже когда задача решается отображением данных в не самых эффективных видах, страдает от двух фундаментальных проблем:
В отношении первой проблемы, когда люди начнут уставать от просмотра сотен красиво раскрашенных кружков, произвольно расположенных на экране, что нам останется делать — лишь заставить их постоянно вращаться и крутиться? Относительно второй проблемы, диаграмма которая привлекает внимание через отображение информации в неэффективной форме — это далеко не всегда ошибка дизайна. Графики могут быть специально предназначены для того, чтобы и привлекать внимание и чтобы рассказывать информацию — но для того чтобы достичь этого, требуется мастерство.
Для того чтобы продемонстрировать, как диаграмма с кружками, наподобие той которая появилась в Tableau 8, была полезна в его работе, Скелтон опубликовал следующий пример:
Название диаграммы: Где работают сотня самых высокооплачиваемых сотрудников
Эта диаграмма показывает потенциально интересную тему для жителей Ванкувера, но Продолжить чтение →
Спидометры и термометры выглядят просто отлично. Они делают скучные страницы такими, что хочется их назвать eye candy. Но нужно учитывать, что они достаточно сложны для восприятия, когда их слишком много.
Визуализации типа «спидометр» позволяют мысленно установить рефлекторную связь с привычными объектами из реального мира (в данном случае — спидометром) и за счет этого выстроить интуитивные градации «плохо—хорошо», «много—мало», при иллюстрировании значения план-фактных показателей. Они привлекательны и легко читаются.
Однако давайте поговорим не только об их преимуществах, но и недостатках. Существенная (для проектировщика дэшбордов) проблема в том, что они занимают много места. Поэтому если на экране много показателей, стоит задуматься об оптимизации формы спидометра. Например, у платформы IBM Cognos 10 есть целый набор разных визуализаций спидометра:
Кроме того, спидометры однопараметричны, а это существенно ограничивает возможности их применения: так, с их помощью невозможно показать историю значений переменной или же ее состав. Это означает, что к выбору показателя для каждого элемента дэшборда нужно относиться с большим вниманием. К примеру, использовать замечательный путеводитель.
А попытка навесить на спидометр несколько переменных приведет к полной нечитаемости всего графика в целом. В примере — статистика по итогам голосования за политические партии в Германии (в России статистика неинтересная, сами понимаете).
Давайте попробуем разобраться: что же на самом деле изображено на графике? Всего лишь численные значения распределения предпочтений электората, в процентах. Однако не проще ли было записать их в виде столбиковой диаграммы? Те же самые данные можно изобразить вот так:
Кроме того, чтобы оценить эффективность каждой отдельной политической партии относительно планировавшегося для нее результата, можно использовать уже знакомые нам bullet charts. На каждую диаграмму разместим шкалу серого, чтобы примерно оценить уровень результативности. В дополнение можно было бы добавить спарклайны — для исторических данных. В итоге визуализация данных становится более простой и понятной, но занимает гораздо больше места: для каждой партии отдельный график и у каждой своя собственная шкала — хотя это вызывает уже другие вопросы ;).
Эффективных вам дэшбордов!