Этот опыт и вдохновил нас запустить собственную инициативу. Мы тоже работаем с эго-документами и пытаемся выстроить цепь от оцифровки источника до его включения в научный оборот. Только в нашем фокусе менее откровенные, менее личные тексты. Они не хуже и не лучше, просто другие – и мы им задаем иные исследовательские вопросы.

<p>Волонтер vs FineReader</p>

Задолго до запуска нашего проекта стало понятно, что собственными силами обработать все документы представляется нереалистичным: в нескольких архивах мы обнаружили более 6700 дел с воспоминаниями. И это только относящихся к нашему региону. Даже если взять только самый ценный пласт документов (стенограммы вечеров памяти), нам предстояло бы обработать 450 дел – реальный объем, но все-таки очень трудозатратный.

В самом начале мы с Юрием Хоркушем, моим другом и сооснователем этой инициативы, долго обсуждали, стоит ли привлекать волонтеров к такой работе. Казалось бы, раз большинство текстов машинописные, почему бы их просто не прогнать через какой-нибудь FineReader? Мы даже провели небольшой эксперимент: взяли схожие по объему и сложности тексты и обработали их двумя способами. Оказалось, что скорость примерно одинаковая. После автоматического распознавания приходилось исправлять искажения, вызванные, например, не очень хорошим качеством фотографии; там, где в оригинале допущены орфографические ошибки, используется старая орфография и грамматика, все так же приходилось ставить примечания; все так же вручную расставлялись теги. Так что при любом сценарии без человеческого глаза не обойтись. Кстати, некоторые волонтеры именно сверяют тексты, а не набирают их.

Также нам важно в каждом тексте выделить самые интересные, эмоциональные моменты. И здесь уж точно машина не товарищ. Более того, здесь ценнее мнение именно обычного человека, а не нашего редактора, которого сложно удивить. Плюс, привлекая волонтеров, мы тем самым знакомим человека с этим специфическим источником, с рабочей тематикой, с нашим проектом. Мы знаем людей, которые помимо помощи в расшифровке воспоминаний регулярно просматривают нашу группу, участвовали в научно-популярном фестивале (мы его проводили 26 июня 2022 года). То есть работа с волонтерами становится еще и элементом просвещения и продвижения.

По совету «Прожито» мы разместили наш проект на платформе «Люди науки». На его страничке есть ссылка на небольшую форму, где достаточно указать свои контакты и объем свободного времени – и волонтер в деле. В течение 2‒3 дней с ним связывается наш куратор, он высылает инструкцию и первое задание в виде PDF-файла, в котором находятся нужные электронные образы из архивного дела. Волонтер перепечатывает текст и расставляет теги:

● имена – многие в мемуарах упоминают других людей, важно это систематизировать;

● предприятия – историкам необходимо понимать, где работал человек, в каком контексте упоминаются заводы и фабрики;

● даты событий;

● технические теги (у номеров страниц, абзацев).

Саму инструкцию можно посмотреть по ссылке в конце главы, ее мы разработали на базе методички «Прожито». Так что нам повезло: благодаря поддержке старших коллег мы быстро прошли подготовительный этап и принялись за дело.

Но мы отвлеклись. Итак, волонтер отправляет размеченный текст нам, редактор его просматривает, правит, проверяет факты. Чтобы документ был готов к загрузке, остается составить грамотное археографическое описание (название документа, дата и место создания, автор и т. д.), написать биографические справки и при необходимости сделать примечания – таким образом, документ проходит все процедуры, как если бы мы его готовили к изданию в бумажном сборнике.

С середины февраля 2022 года по середину сентября нашу заявку заполнили 183 человека. Но проверили себя делом, то есть выполнили одно и более заданий, только 57 человек. Кто-то еще находится на стадии обработки первой порции текстов, кто-то еще не ответил нам.

Но пока нам достаточно текущего ежедневного потока людей. Среди них есть «ударники труда», регулярно берущие задания в повышенном объеме. Я хочу перечислить их имена: Марина Брик, Ксения Кириллова, Никита Ревков, Оксана Белоусова, Ольга Мирскова. Мы им вдвойне благодарны. Порой нам сложнее сохранять баланс между скоростью пополнения материалов и скоростью их обработки. В нашей базе сейчас электронные образы около 90 архивных дел, треть из них уже полностью обработана волонтерами, еще треть – в большей степени, остальное – частично.

Нам удалось привлечь достаточно мотивированных волонтеров, распространяя информацию только через профильные каналы: платформы «Люди науки», «Добро. ru», волонтерский раздел Superjob.ru. Иногда мы напоминаем об этой инициативе в наших соцсетях. Мы не ведем массовой пиар-кампании, и на этом этапе, кажется, это правильно.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже