Программа, лежащая в основе этого алгоритма, была разработана на базе более раннего и примитивного софта, используемого для чтения написанных от руки цифр на банковских чеках. Эта задача – узнать, скажем, небрежно накаляканную четверку, которая может писаться как с разрывом, так и одной сплошной линией (4 или 4), – не представляет трудности для большинства людей старше двух лет, но очень сложна для компьютера: он должен шаг за шагом учиться распознавать цифры. Первый шаг – получить изображение и разбить его на элементарные составляющие: набор черных пикселей и набор белых пикселей. Потом алгоритм накладывает это изображение на имеющееся у него изображение написанного от руки нуля, удаляет черные пиксели там, где линии не совпадают, обрезая края, и подсчитывает оставшиеся: чем их больше, тем больше пересечение. После этого он проделывает ту же операцию с еще десятью тысячами изображений нулей, выдавая еще десять тысяч результатов и усредняя их, потом то же самое с множеством единиц, двоек и так далее: результатом ста тысяч сравнений станут десять средних значений, и самое большое из них почти наверняка будет получено в ходе анализа цифры с наибольшей площадью пересечения с образцом, то есть четверки.

Другими словами, это холодный математический расчет, он лишен того, что свойственно людям, – проницательности, мудрости, интуиции, – и кажется мучительно запутанным и утомительным, вот только микропроцессор может выполнить его менее чем за секунду, а это значит, что компьютер и человек идентифицируют написанную от руки цифру примерно с одинаковой точностью практически за одинаковое время.

В общем, фейсбучный алгоритм распознавания закономерностей вырос из этой программы, но необычайно усложнился: вместо аналоговых бумажных чеков, существующих в двух измерениях, он теперь анализирует цифровые данные в миллионах измерений. Каждое действие и каждая комбинация действий Лоуренса, каждый пост и лайк, каждый комментарий и сообщение, каждая запись в файле журнала – это всего лишь одно такое измерение, которое алгоритм использует для сравнения Лоуренса с миллиардом других аккаунтов в «Фейсбуке», чтобы выяснить, что же он такое. Чтобы обрезать все вылезающие края и усреднить результат. Чтобы выявить схожесть Лоуренса с другими. Алгоритм собирает все его биографические и поведенческие данные, а также данные о местоположении и о социальных взаимодействиях и во всех мыслимых комбинациях сравнивает их с данными остальных пользователей, накладывая одни измерения поверх других, чтобы обнаружить те глубокие и невидимые комплексные пересечения, связи и сходства, которые позволят проанализировать Лоуренса, охарактеризовать его и определить в ту или иную группу.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже