Разберем небезынтересный пример визуализации данных -
диаграмму факторов смертности населения Америки и мира (OECD-страны) за последние 50 лет "Why we die".
Авторы визуализации - Чэд Хэген и Джен Крисченсен.
Оригинальный скриншот
Скриншот с пунктами замечаний
1.
Самая большая проблема этой диаграммы стандартна для всех Stacked graphs и заключается в непозволительно большом факторе лжи (lie-factor).
Здесь предельно ясно показано, как все следующие за сердечно-сосудистыми заболеваниями факторы послушно повторяют рельеф данных о ССЗ. Нет возможности проследить реальную динамику остальных данных.
Обычный линейный график позволил бы лучше понять независимую динамику разных факторов. Заливка площади цветом, хотя бы по клику на фактор, добавила бы этому стандартному и немного приевшемуся решению зрелищности. Если и это недостаточно захватывает визуально, существует возможность построения 3D диаграмм в перспективе на основе линейных графиков, как это было сделано командой Good magazine для датасета "No more fish in the sea", с оговорками на читаемость.
2.
Обращу ваше внимание на сильный разброс амплитуды данных, который не позволяет видеть в хорошем приближении одновременно самый крупный подмассив (ссз) и все остальные субсеты. Некоторые субсеты теряются в этом размере, например, Undiagnosed & unknown causes.
Этот вопрос решается логарифмическим сглаживанием разброса величин.
3.
Приведенная цветовая дифференциация выполнена не лучшим образом, в гамме использовано много слаборазличимых оттенков.
В этом может помочь теория цвета, позволяющая найти гармоничные сочетания оттенков разных цветов с различной яркостью (последнее для слабовидящих и плохо различающих насыщенность оттенков).
4.
Бежевая обводка, участвующая в дизайне диаграммы, включена в саму диаграмму и ошибочно считывается как участник датасета. К тому же оттенок обводки недостаточно нейтрален и пересекается с оттенком участвующих в диаграмме данных.
5.
Категоризация причин была бы здесь уместной для понимания комплексной картины. Поскольку данные уже кластеризованы, это не обязательное показание.
6.
Легенда. Тафти предписывает максимально облегчать линии дизайна диаграммы, но не в ущерб считываемости, как это сделано здесь. Человеческое зрение устроено таким образом, что распознавание паттернов приводит к иллюзиям восприятия. Наш глаз плохо следит за длинными горизонтальными линиями (уместно вспомнить рекомендацию не верстать тексты широкими колонками), и еще хуже может схватить динамику этих линий, к тому же весьма плохо распознает углы.
Здесь горизонтальные вспомогательные линии графика должны помогать взгляду оценивать динамику верно.
Добавлю, что плохо понятно, на каких годах заканчивается график и данные: 2008, 2010, 2012.
7.
На верхней диаграмме хорошо видна нехватка горизонтальных линий-гайдов для слежения взглядом за графиком.
Кроме того, динамика линий повторяется на всех из них, это любопытно, и хотелось бы видеть, чем объясняются повторяемые пики и падения ожидания (смотрите прошлый пост с инфографикой от НАСА про повреждения летательных аппаратов, где пики повреждений отмечены дополнительными разъяснениями).
За ссылку спасибо Ивану
_navi_ Тарасову.