Еще нужно продумать, что вы будете делать с данными, которые получаете и предоставляете волонтерам. Где вы будете их хранить, есть ли у вас для этого дополнительные ресурсы? Что будет происходить с данными, когда вы их получите от волонтеров? Например, они будут попадать в базу данных вперемешку или вы планируете их предварительно сортировать в определенном порядке с определенной маркировкой? Будут ли они доступны только вам, или это будет открытая база? Последнее в проектах гражданской науки предпочтительнее: если волонтеры не видят результаты своего труда, то не чувствуют себя вовлеченными в решение задачи.
Все данные, которые ученые получают от волонтеров, должны быть проверены и подвергнуты сомнению. Есть много разных подходов к таким проверкам, их алгоритм выбирают научные кураторы. Расскажем о некоторых.
Статистический подход: в основе почти каждого проекта по анализу научных данных лежит статистический метод, одни и те же данные по нескольку раз проверяются разными людьми. Если результаты анализа разными волонтерами сильно расходятся, эти данные отправляются ученым для последующей верификации.
Социальный подход: волонтерам предлагается отслеживать и проверять информацию, собранную менее опытными участниками. Социальный метод хорошо зарекомендовал себя в бердвотчинге, где более опытные в определении видов птиц участники помогают проверить наблюдения остальных.
Географический подход: используются известные географические знания для оценки достоверности информации, которую получают волонтеры. Разновидность этого подхода – использование зафиксированной ранее, уже известной информации (даже если она устарела) для проверки новой.
Предметный подход: сопоставление полученных от волонтеров сведений со знаниями о предметной области. Например, в проектах, где производится сбор метеорологических или астрономических наблюдений, почти всегда есть прогнозы об ожидаемых наблюдениях как в пространстве, так и во времени. Таким образом, новые данные можно сверить с предсказанными и дополнительно проверить в случае значимых расхождений.
Инструментальный подход: основывается на данных от оборудования, которое использует человек. Сейчас в смартфонах интегрировано много датчиков: например, файлы изображений, которые фиксируются в смартфонах, включают координаты GPS и отметку времени (этими данными обычным волонтерам трудно манипулировать). Автоматическая инструментальная запись информации обеспечивает доказательство качества и точности данных.
Процессуально-ориентированный подход: участники проходят определенную подготовку перед сбором информации. Процесс сбора или анализа данных строго структурирован, чтобы гарантировать, что полученная информация имеет нужное качество. Волонтеры получают инструкции и стандартизированное оборудование, проходят онлайн-обучение. Регистрация или классификация данных так же четко структурирована. Например, проекты на платформе Zooniverse требуют от участника пройти обучение, прежде чем позволить ему проводить анализ данных.
Часто на открытых платформах по сбору данных есть уже встроенные алгоритмы, которые проверяют данные за ученых. Например, масштабный проект по сбору наблюдений за птицами eBird автоматически проверяет данные в два этапа:
● программа обнаруживает аномалии (то есть наблюдения, необычные для данного региона и времени года);
● затем используется программа проверки качества данных, основанная на прогнозируемом опыте наблюдателя, чтобы решить, следует ли помечать аномалии для проверки.
Изначально нужно установить все критерии, по которым волонтер может подходить для вашего проекта. Бывают общие условия вроде возраста, пола, места проживания и специфические, например наличие светосильной фототехники или возможность уделять вашему проекту какое-то время ежедневно, знание определенного языка или наличие навыка вроде горного туризма. В общем, все, что может сузить круг поисков ваших волонтеров, а им самим поможет понять, смогут они участвовать в проекте или нет.