В любом случае, у корпораций есть гораздо более выгодные способы использовать данные, чем их примитивная продажа. На продаже данных дают заработать небольшим стартапам, собирающим дополнительные данные — биометрию, данные о здоровье, занимающихся распознаванием лиц, эмоций и мотиваций. А вот бизнес-модель крупнейших цифровых корпораций типа Facebook, Microsoft, Twitter или Google основана на торговле поведенческими продуктами — это приносит каждой из них десятки миллиардов долларов ежегодно, не случайно капитализация некоторых из этих компаний сопоставима с целыми отраслями экономики, например, энергетикой. Поведенческие продукты вырабатываются при помощи систем с искусственным интеллектом из персональных или дополнительных данных на своего рода «фабриках обработки данных», расположенных в «облаках» («облачным лидером» выступает компания Amazon, капитализация которой составляет уже пару триллионов долларов и за время коронавирусного кризиса только выросла).

Немногие люди отдают себе отчет в том, насколько велики объемы и разнообразны данные, собираемые этими компаниями, и насколько совершенны методы их обработки. Ученые из ведущих академических учреждений мира могут только мечтать о таких возможностях.

В принципе, работу компаний «большой цифры» я бы сравнил с салоном speakeasy времен сухого закона в Америке. С пыльной улицы виден облупленный фасад с надписью «Аптека», но если пройти внутрь, то через тайную дверь, о которой знают только свои, можно спуститься в подвал, где рекой льется виски, а лучшие люди города сидят за покерным столом. Так и тут: с виду, например, Google — это скромный поисковик, который выдает несколько результатов по запросу пользователя. И запоминает их: все, разумеется, для повышения качества услуг — совершенствования системы поиска!

Однако пока в «аптечной» части Google аптекарь лениво ищет по полкам нужное клиенту снадобье, в подпольной части уже вовсю берут в оборот всю подноготную этого клиента — чтобы найти какую-нибудь его слабость, разбудить его внутренних демонов, и подсадить его на что-нибудь — все равно на что — так, чтобы он больше не вышел из этой аптеки никогда.

Так самым ценным ресурсом для цифровых платформ оказывается «поведенческая прибавка», полученная от пользователей и вроде бы совсем не нужная для «основной» деятельности тех же поисковиков или соцсетей. Какое отношение к поиску, допустим, сайта о рецепте пиццы имеет сохранение в памяти Google всех запросов конкретного человека, данных о том, в какой манере человек набирал запрос, исправлял ли его и как именно, насколько грамотно и быстро он формулирует запрос, как долго был на сайте, куда пошел дальше, совершил ли покупку, каким образом это сделал, где в это время физически находился, какие сайты любит посещать, в какое время суток, как долго на них находится и так далее? Не все знают, как многое можно сказать о человеке не по самим данным, а по метаданным, то есть вроде бы косвенной информации — хотя можно догадаться, что история наших блужданий в интернете многое о нас может рассказать.

«Поведенческая прибавка» для Twitter — это, например, картинка профиля пользователя: ее цвет, тип изображения, композиция, данные, считанные с лица, если оно представлено, демография, выражение, эмоция и так далее. Затем в копилку идут метаданные, считанные с селфи, вплоть до стиля и визуальной текстуры. В инстаграме анализируется тон, яркость, насыщенность изображений и другие признаки, по которым автоматически составляется психологический портрет любителя фотографировать. Активность людей в Twitter, Facebook или Instagram позволяет успешно составлять пятифакторную модель их личности, на основании которой можно установить о человеке очень многое, от сексуальной ориентации до склонности к неврозам, от экстравертности до открытости новым идеям… А уже базируясь на этих моделях, можно предсказывать, например, «удовлетворенность жизнью» или даже предлагать услугу «выберем вашего президента», как это сделала с помощью данных «Фейсбука» компания Cambridge Analytica.

Стоит сказать отдельно, что поведенческий микротаргетинг основан не на демографии, как можно было бы подумать, а на обработке цифровых профилей пользователей. В любом случае, есть достаточно формальная операция «обезличивания», а есть вполне эффективные способы идентификации, которые позволяют обратить так называемые «обезличенные» данные обратно в привязанные к конкретным людям.

Перейти на страницу:

Похожие книги