Во-вторых, мы получили много данных, как и команду, которая продолжает эти данные собирать и обрабатывать. Мы начали жить в другом измерении. То есть сейчас мы прекрасно понимаем, что должны существовать в условиях, когда мы уже не можем проверить точность и правильность определения каждой фотографии. Теперь мы, например, должны разрабатывать методы автоматического контроля данных – это отдельная, очень интересная область. Мы занимаемся разработкой алгоритмов поиска ошибок – редких, случайных, досадных, но которые ничего по большому счету в наших знаниях не меняют. Мне пришло в голову такое сравнение: раньше мы наш мир видели очень хорошо и четко, но в этом мире мало что было – он был просто устроенный и не очень разнообразный. Теперь же мир данных о природе, который нас окружает, большой, разнообразный и прекрасный, но мы видим его чуть-чуть размытым из-за того, что появляются эти небольшие ошибки. Мы стали чуть близорукими, но мир, который мы видим, теперь прекраснее. И в нем гораздо больше интересного.
Вообще, в научном сообществе до сих пор существует недоверие к данным, полученным от волонтеров, что, конечно, совершенно неоправданно. В нашем случае важно понимать: это краудсорсинг. У него есть как плюсы, так и минусы. Плюс в том, что рано или поздно правильное название для всего будет найдено. Минус в том, что в каких-то случаях это займет время. Фактически все вопросы на iNaturalist о том, что «правильно», решаются демократическим путем, то есть голосованием, в котором может принять участие любой участник платформы, и его голос будет равносилен голосу настоящего эксперта. Голосование может быть не только по тому, как растение нужно называть, но и еще по десяти параметрам, например: какая фенофаза изображена, снято растение в культуре или дикой природе и так далее. Также важно понимать, что само название растения – это не истинное знание, а гипотеза, которая на сегодняшний день подкреплена некоторым объемом исследовательских данных. У каждой такой гипотезы есть корпус данных наблюдений, который постепенно уточняется, дополняется молекулярно-генетическими, сравнительно-анатомическими, микроморфологическими данными. В результате может накопиться их критический объем, который позволит нам начать пересмотр существующей гипотезы. Предположить, например, что перед нами не один вид, а два. Наступит момент, когда у двух гипотез будет примерно равное количество поддерживающих. Какая-то из них окажется правильной, а какая-то постепенно отомрет, будет признана ложной. Это все нормальное развитие науки.
Немаловажны результаты нашей работы и для положительного имиджа страны, облика России с точки зрения обеспеченности данными. Платформа iNaturalist – международная, и мы можем сравнивать себя в процентных соотношениях с остальным миром и радоваться тому, как «Флора России» меняет объем и структуру данных внутри платформы. Немного статистики:
● Россия занимает третье место в мире по наблюдениям сосудистых растений на iNaturalist, отставая от Канады и США. По всем же группам организмов Россия сейчас на 4-м месте после США, Канады и Австралии;
● в России на iNaturalist преобладают наблюдения сосудистых растений: к ним относятся 57,4 % всех наблюдений за живыми организмами. В мире этот показатель не превышает 39,4 % и постепенно снижается – в основном люди снимают животных;
● у нас преобладают наблюдения со свободными лицензиями: эти данные можно использовать как в научной, так и, на самом деле, в любой работе, главное – правильно оформлять ссылки. У нас таких наблюдений 88,3 %. Показатель в мире – 66,5 %, то есть каждый третий ставит на свои наблюдения ограничение «все права защищены». Я уже отметил, что мы это делать не рекомендуем;
● благодаря активной работе экспертов 80,0 % наблюдений из России верифицированы, тогда как в мире всего 61,7 %, а остальные данные находятся в серой зоне;
● в России очень высокий показатель числа «наблюдений на человека» – 144,8. Видно, что мы стараемся удерживать, мотивировать тех, кто к нам приходит. В мире этот показатель в три раза ниже – 49,3;
● доля данных, мигрирующих из iNaturalist в GBIF: Россия – 71,1 %, мир – 44,0 %.
По числу данных по всем организмам Россия сейчас занимает в GBIF 26-е место, а если мы возьмем только сосудистые растения – 16-е. Это хорошо показывает дисбаланс данных по России в пользу растений, достигнутый нами. Наверное, это может стимулировать коллег, которые занимаются другими группами живых организмов, достигать таких же результатов. В 2023 году мы с Мексикой бьемся за 15-е место по абсолютному числу данных. Я думаю, обгоним.
Мы продолжаем работать, потому что это хорошее занятие – просто фотографировать растения и соревноваться по числу наблюдений с США, Канадой и Австралией. Прекрасный способ сразиться в честной борьбе.