Програмное обеспечение, позволяющее визуализировать статистическую информацию. Помощники инфографера. Для того, чтобы визуализировать информацию, не обязательно быть дизайнером. Накопилось уже много всяких разных инструментов от всем известного Excell до специализированных инструментов для журналистов Knightlab. Мы делимся с вами самым интересным в этом разделе. А какие инструменты знаете вы? Делитесь в комментариях к данному разделу. Присылайте письма.
Knight Lab — это проект Северозападного университета (Northwestern University) в рамках которого технологи, журналисты, преподаватели и студенты разрабатывают новые инструменты для он-лайн сторителлинга.
Некоторые из инструментов так и остаются на уровне прототипов, другие — выполняются под заказ, а третьи — открыты для свободного использования всем желающим. Предлагаем вам краткий обзор четырех таких инструментов — TimelineJS, StoryMapJS, JuxtaposeJS и SoundCiteJS.
Генератор интерактивных таймлайнов для web. Можно забить все необходимые данные в специальный шаблон на Google Таблицах, подтянуть картинки и видео, — и TimelineJS сгенерирует HTML код для сайта.
Рик Гордон – профессор и руководитель отдела цифровых инноваций в Школе журналистики Медилла, основаmель постдипломной программы по журналистике в новых медиа. Большая часть его карьеры посвящена исследованию областей, в которых журналистика пересекается с технологиями. Профессор Гордон одним из первых стал использовать программные аналитические инструменты (таблицы и базы данных) для анализа данных в журналистских целях. Он был среди первого поколения журналистов, предпринимавших несмелые попытки онлайн публикаций в газете The Miami Herald. В школе Медилла он разработал инновационные курсы, в рамках которых студенты исследуют цифровой контент и сообщества, разрабатывают новые формы сторителлинга, которые используют уникальные возможности интерактивных медиа. Помимо преподавания и публикаций по журналистике данных он является руководителем новых сообществ в Центре управления медиа Северо-Западного университета (США), где он ведет исследовательскую инициативу, посвященную изучению влияния онлайн-сообществ (в том числе социальных медиа) на журналистику и издательское дело.
В конце 80-х годов я был репортером и только начинал пользоваться компьютерными программами для анализа данных, тогда «журналистика данных» заканчивалась сразу же после публикации материала в газете.
Сейчас публикация статьи – только начало. Все те же данные могут быть преобразованы в убедительную визуализацию или в новостное приложение, к которым пользователи будут не раз возвращаться и после публикации материала. Таким образом, журналистика данных – бывшая когда-то задачей для одного игрока – оказалась командным спортом.
Итак, если ваша новостная организация планирует заняться журналистикой данных, в каком направлении стоит двигаться? На недавней конференции Американского общества новостных редакторов в Вашингтоне я говорил о том, что редакторы новостей должны думать о трех измерениях журналистики данных и о трех различных типах журналистских навыков. Вот график, который иллюстрирует мои слова:
Суть диаграммы в следующем: чтобы качественно решать задачи журналистики данных, новостная организация должна привлекать к работе специалистов с тремя отличными друг от друга наборами навыков. Продолжить чтение →
В последнее время было создано немало чистой воды произведений искусства в формате визуализации, и некоторые из них попали на выставки в MoMA и другие многочисленные художественные экспозиции во всем мире. Но бизнес-лидеры все еще спрашивают, а применима ли визуализация данных на практике?
Как ученый-резидент исследовательской лаборатории Нью-Йорк Таймс я сотрудничаю с одной из самых продвинутых в области цифровых исследований и разработки команд в мире. Вместе мы стараемся выяснить, каким образом можно получить применимые на практике инсайты, используя большие данные. Насколько большие? Массивные: мы документируем каждый твит и ретвит, кликаем по каждой сокращенной ссылке из Twitter и Facebook, которая ссылается на материалы Нью-Йорк Таймс, а затем объединяем эту информацию с историей поведения пользователей, пришедших по этим ссылкам на страницы Таймс. Этот проект — родственник широко известного Cascade, Cascade 2.0.
Вышеупосянутые данные нужны нам для того, чтобы понять и предсказать, в каком случае завязавшееся в сети обсуждение выльется в приток посещений на сайт Таймс, а когда этого не произойдет. Нам важно знать, каким образом распространение информации из уст в уста может привести на сайт читателей, подписчиков и доход; как Таймс может улучшить свое участие в онлайн дискуссиях, чтобы стимулировать вовлеченность читателей; как мы можем идентифицировать по-настоящему влиятельных пользователей или лидеров мнений, которые мотивируют пользователей взаимодействовать с контентом издания и как Таймс может вовлечь этих влиятельных пользователей, удовлетворив при этом их собственные потребности и интересы. Проделав эту работу, мы можем превратить тот статистический анализ, который вы увидите ниже, в изящные, художественные потоки данных в реальном времени.
Обработка потоков, архивирование сессий, хранение и управление информацией сами по себе — гераклов труд. Но гораздо более сложная задача состоит в преобразовании красивых больших данных в применимое на практике, значимое и способное помочь в принятии решений знание. Мы обнаружили, что визуализация — один из самых важных путеводителей в этом поиске знаний, необходимых для понимания того, где нам стоит искать и что именно мы должны найти в нашем статистическом анализе.
Например, вот три визуализации, которые помогли нам получить определенное знание. В виде линий и точек на них отображены каскады твитов и ретвитов, связанных с тремя различными публикациями в Таймс. Эти данные мы объединили с информацией об уровне кликабельности каждой статьи, она синхронизирована по времени с твитами и выглядит как диаграмма черного цвета под каждым каскадом. Каждый график рассказывает новую историю о взаимодействии с контентом.
Вокруг первой статьи возникло большое обсуждение в Twitter и несколько больших скачков трафика. Но, похоже, что уровень кликабельности не зависел от обсуждений в Twitter: самый большой скачек трафика, выделенный на графике голубым цветом, произошел, когда наблюдалась очень низкая активность в микроблогах. В этом случае, вероятно, вовсе не дискуссия в Twitter, а заметная ссылка на нашу публикацию в стороннем блоге или новостной статье, привлекла большое количество трафика.