Читать Эпоха открытий Онлайн и Бесплатно. Библиотека Читка

Тем не менее идея многоязычного интернета постепенно начинает выглядеть все более правдоподобной. Раньше мы не принимали в расчет того, насколько широко среди людей распространено стремление изучать другие языки, – по недавним оценкам, таких людей в мире 1,2 миллиарда [21]. Выяснилось, что перевод фрагментов интернета – полезная практика для изучающих иностранные языки, и студенты с удовольствием пользуются ею и готовы делать это бесплатно. В результате произошел колоссальный скачок наших совокупных возможностей перевода. Особенно сильно это ощущается в сфере развлечений и другого популярного контента. В Китае голливудские блокбастеры и популярные сериалы канала HBO появляются в интернете в тот же день, когда выходят в США, вместе с субтитрами на мандаринском диалекте, которые делают фанаты, практикующиеся в английском. Для образовательного интернет-портала Khan Academy добровольцы перевели более чем на 65 языков почти все шесть тысяч учебных видео. Интернет-портал TED привлек более 22 тысяч добровольцев, чтобы перевести более 80 тысяч выступлений TED Talks более чем на 100 языков. В общей сложности в 2015 г., по нашим оценкам, количество добровольных переводчиков в мире составило от 2 до 4 миллионов человек, и в течение одного года они подарили человечеству от 25 до 50 миллионов часов бесплатных переводческих услуг в таких областях, как развлечения, образование, новости и ликвидация последствий стихийных бедствий (путем перевода твитов жертв в реальном времени для аварийно-спасательных служб).

Умные бизнес-модели определяют новые способы оптимизации наших коллективных переводческих усилий и приложения их к общедоступному контенту, который добровольцы оставляют без внимания (или к частному контенту на платной основе). Один из примеров – платформа Duolingo, разработанная доктором Луисом фон Аном, профессором информатики из Университета Карнеги-Меллон. Учебная платформа доступна в сети и в виде приложения, и она предлагает студентам, изучающим языки, переводить реальные предложения из интернета: фрагменты статей Википедии или новостных лент CNN. Когда несколько студентов переводят одну фразу одинаково, система расценивает такой перевод как достоверный, а затем отдает или продает его обратно владельцу оригинального текста. Этот способ обучения является бесплатным для пользователей, включает в себя игровой элемент и очевидно эффективен, поэтому студенты, изучающие иностранные языки, охотно им пользуются. Duolingo была запущена в июне 2012 г. и первоначально насчитывала 300 тысяч пользователей. Через три года на платформе было зарегистрировано 25 миллионов пользователей (из них 12,5 миллиона активных), изучающих 13 разных языков, еще 8 языков находились на стадии разработки [22]. Если достаточное количество пользователей Duolingo перейдет от уровня новичка до высших уровней владения вторым языком, они в короткие сроки смогут разрушить некогда непреодолимые языковые барьеры интернета. Если число продвинутых пользователей Duolingo достигнет миллиона, они смогут полностью перевести англоязычную Википедию примерно за 100 часов.

Второй масштабный рубеж, который мы коллективно преодолеваем, – анализ научных данных. «Во многих областях науки мы ограничены не тем, какие данные можем получить, а тем, что мы можем сделать с имеющимися у нас данными», – считает астрофизик Крис Линтотт [23]. Информации более чем достаточно – чего нельзя сказать о нашей способности ее обрабатывать. Наши компьютерные устройства все лучше справляются со сбором данных, которые нужны исследователям (в случае Линтотта это изображения далеких галактик), но они по-прежнему плохо умеют распознавать закономерности, которые мы ищем, и отделять значимые сигналы от бессмысленного шума. В результате огромный массив данных, ожидающих обработки, растет не по дням, а по часам. Большой адронный коллайдер ЦЕРН в Швейцарии каждую секунду производит около гигабайта новых данных о поведении фундаментальных частиц [24]. Все машины секвенирования ДНК в мире каждую секунду выдают от одного до двух гигабайт данных о том, как работают наши гены [25]. В НАСА данные буквально льются с неба: различные миссии каждую секунду генерируют около 150 гигабайт новых наблюдений о нашей Вселенной [26]. (Для сравнения, в 2015 г. более полутора миллиардов пользователей Facebook вместе загружали около 5 гигабайт данных в секунду. Можете ли вы быть в курсе новостей целого мира? Проблема НАСА в тридцать раз больше.) Такие же потоки извергаются на головы климатологов, геологов, социологов, экономистов и других исследователей, работающих с данными. Наука уже нашла ответы на многие важные вопросы. Мы просто этого еще не знаем.

Перейти на страницу: