Надежда на то, что вероятностная математика, примененная к большим объемам социальной информации, может улучшить предсказания о будущем человеческого общества, выглядела чрезвычайно привлекательно для правительств, предпринимателей, экономистов и социальных теоретиков.

В начале девятнадцатого столетия сошла, как пишет Иэн Хекинг, «целая лавина чисел». Чиновники и ученые принялись собирать огромное количество данных, пытаясь выявить закономерности в росте населения, уровнях преступности, распространении инфекционных заболеваний, климате, экономических колебаниях и вообще в развитии крупных и сложных систем. Конечно, все древние империи так или иначе собирали сведения об урожае и проводили переписи. Однако новинкой оказались именно колоссальный объем собираемой и публикуемой информации, разброс задаваемых вопросов и математические хитросплетения анализа данных. Открывались все новые и новые «законы». Адольф Кетле, один из пионеров современного статистического мышления, поражался их регулярности: «Мы заранее знаем, – писал он, – сколько людей запачкают свои руки чужой кровью, сколько будет мошенников, сколько отравителей, и это известно нам заранее едва ли хуже, чем число грядущих рождений и смертей»286. Возможно ли, чтобы человеческое общество в своем развитии подчинялось законам столь же регулярным, как законы астрономии?

В двадцатом столетии ограничения великих теорий социального развития, скажем, теорий Конта и Маркса, стали очевидными. Но в более скромных масштабах социальная статистика способна давать подсказки по значимым вопросам, например, по моделям преступности, распространенности различных заболеваний или потребности в различных типах инфраструктуры. Стал возрастать сбор социальной, экономической, медицинской, криминологической и прочей социальной статистики. Статистическая информация используется во всем мире для управления инвестициями, подготовки к пандемиям, для управления экономикой и понимания сложных систем, таких как глобальный климатический режим.

ИТ-революция конца двадцатого столетия и создание Интернета увеличили количество данных, которые можно собирать, хранить и анализировать. Стало возможным выявлять важные закономерности не только по выборкам, но и по полным наборам данных. В двадцать первом веке, в эпоху «больших данных», информация о вкусах отдельных потребителей, шаблонах их расходов и активности в социальных сетях (каждый «лайк» отмечается и записывается) используется для извлечения огромной прибыли, поскольку она поразительно точно предсказывает потребительский спрос.

Хотя термин «большие данные» часто ассоциируется с маркетингом, впервые он появился в таких науках, как астрономия и геномика, где сложилось понимание, что обширные наборы данных могут изменить известную и предсказуемую картину. Слоуновский цифровой обзор неба [112], проект 2000 года, за несколько недель собрал больше астрономических данных, чем было накоплено ранее, за всю историю астрономии287. Могущество больших данных складывается из синергии между колоссальными объемами информации и новыми аналитическими техниками, которые используют эту информацию для выявления скрытых закономерностей и тенденций: «Речь идет о применении математики к огромному количеству данных, чтобы вывести вероятности: вероятность того, что сообщение электронной почты является спамом; что опечатка «teh» должна читаться как «the» и т. д.»288. Древним прорицателям шептали боги, а сегодня мы находим намеки на скрытые закономерности, погребенные в грудах данных; они могут быть превращены в правдоподобные предсказания, в богатство и власть.

Информационные технологии и вычислительная техника

Возможность хранить, получать доступ и извлекать огромные объемы данных появилась благодаря информационной революции конца двадцатого столетия.

Современные электронные вычисления зародились в ходе Второй мировой войны. Впрочем, поначалу компьютеры были дорогостоящими штучными изделиями, которые представляли ценность только для правительств, военных служб и крупных корпораций. Широко известно несбывшееся предсказание президента компании «Ай-би-эм» (1943): «Думаю, на мировом рынке хватит от силы пяти компьютеров»289.

Дешевые и повсеместные хранение и обработка информации стали возможными благодаря технологическим нововведениям, которые удешевили компьютерные чипы и позволили компьютерам общаться друг с другом. В 1965 году Гордон Мур, соучредитель производителя чипов «Интел», заметил, что количество компонентов на каждом чипе удваивается каждый год, вследствие чего снижаются стоимость самого компьютера и обработки информации. В 1975 году он уточнил свой прогноз до одного раза в два года, но его открытие было признано и получило известность как закон Мура. В 2020 году обычный смартфон по вычислительной мощности в тысячу раз, а по объему памяти в восемьдесят раз превосходил лучший компьютер 1970 года, но стоил в тысячу раз дешевле290.

Перейти на страницу:

Похожие книги