Компьютеры и цифровые технологии помогают нам хранить и обрабатывать огромные массивы информации, которые год от года только увеличиваются. Мы отцифровываем документы, создаем их в онлайн, структурируем и архивируем информацию в недрах Интернета. Интернет предоставляет возможность не только хранить данные, но и делиться ими. В 1995 году появился термин “open data” или «открытые данные», означающий данные, которые опубликованы в открытых источниках и на которые не распространяются авторские права. В течение последующих пяти лет в журналистике произошли значимые изменения из-за использования и обработки открытых данных. В начале 2000-х годов появляется другой термин – “big data”, который переводится с английского языка как «большие данные» или «большие объемы данных». С появлением этого понятия появляется и другое – “data journalism” или «журналистика данных». Журналистика данных дала второе дыхание или скорее дополнительное дыхание интернет-журналистике, которая долгое время считалась занятием для непрофессионалов, поскольку каждый, у кого есть доступ в Интернет и возможность создавать контент, автоматически считался интернет-журналистом. Дата-журналистику можно считать наиболее сложной и требующей больших умений отраслью интернет-журналистики. Журналистика данных объединила в себе техническую составляющую, которая отражается в сборе и обработке больших объемов данных, и собственно журналистскую составляющую, которая выражается в исследовании темы и представлении ее аудитории в понятном для нее виде. Для журналиста становится просто необходимым умение не только обрабатывать данные, но и ориентироваться в них. Дата-журналистика выдвигает главенствование факта на первый план. Теперь цифры, статистика, карты, диаграммы, таблицы являются не иллюстрирующим материалом, а инфоповодом.

Саму журналистику данных можно определить как направление журналистики, в основе которой лежит использование наборов данных для создания новых информационных поводов, либо для предоставления дополнительных сведений, фактов или уточнений в рамках текущего исследовательского журналистского материала или новостной статьи [10].

Журналистика данных подразумевает не только работу с большим объемом информации, но и умение пользоваться специализированными инструментами для обработки и визуализации данных. Среди таких инструментов можно выделить SPSS – программа для статистической обработки данных и R Studio – программный продукт для восстановления файловых систем. Также журналисту, занимающемуся журналистикой данных, желательно знание определенных языков программирования, таких как Python.

Первым журналистским материалом, основанным на обработке открытых данных, можно считать публикацию 1821 года в The Guardian. В газете было опубликовано исследование стоимости обучения в различных вузах Англии. Для того чтобы читателю было легче воспринимать информацию, редакцией были подготовлены сводные таблицы с ценами обучения [5].

Эксперты, которые занимаются изучением журналистики данных, расходятся во мнении об истории появления этого понятия. Но сходятся на том, какие значимые события к этому привели. Отмечают 1952 год, когда впервые было задокументировано использование компьютера в работе журналиста. Значимое событие, которое тогда произошло, – это использование вычислительной машины UNIVAC I для прогнозирования результатов президентских выборов в США и оценки результатов каждого из кандидатов в президенты – Дуайта Эйзенхауэра и Эдлайя Стивенсона [15].

Другое значимое для журналистики данных событие – формирование понятия “big data”, которое в свою очередь связано с увеличением объемов и скорости получения новых массивов информации. К сожалению, сказать, когда именно появился термин «большие объемы данных», не представляется возможным, можно лишь отметить, что это было сделано где-то в 2001–2002 годах. На то, чтобы дать определение журналистике данных, ушло еще больше времени. Одно из первых толкований было представлено на конференции в Амстердаме в 2010 году [11]. Это была первая в мире конференция, посвященная дата-журналистике.

Журналистика данных неоспоримо требует открытости этих самых данных. Подразумевается, что open data или открытые данные соответствуют следующим критериям:

– открытость доступа. Контент должен быть бесплатным и опубликованным в машиночитаемом виде. То есть эти данные должен распознавать и считывать не только человек, но и компьютер;

– свобода распространения и повторного использования. Это подразумевает использование свободных лицензий;

– запрет на ограничение использования.

Следовательно, можно сделать вывод, что если данные не соответствуют какому-либо из перечисленных пунктов, например, информацию нельзя повторно использовать, то эти данные мы не можем идентифицировать как open data.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже