В другой раз мне понадобилось просмотреть работу Мулхерина о катастрофе "Челленджера", которую я упомянул ранее. Я не мог вспомнить имя автора и набрал "реакция фондового рынка на катастрофу Челленджера". Мне было предложено 2370 веб-страниц. На первой была статья в Slate Дэниэла Гросса о работе Мулхерина. Третьей была собственная страница Мулхерина со ссылкой на запрашиваемый мною отчет. Поиск (в котором, если помните, не присутствовало имя автора) занял 0,10 секунды. Несколько минут спустя я поискал текст песни Рамона о том, как Рональд Рейган посетил кладбище в Битбурге, и это заняло 0,23 секунды, и первая ссылка в списке оказалась именно той, которую я искал.

Если вы регулярно пользуетесь Интернетом, эти примеры эффективности Google вас не удивят. Мы привыкли ожидать от поисковой системы мгновенного ответа с нужной нам страницей в начале списка. Но все же давайте копнем немного глубже и попробуем разобраться в том, что же происходит в эти десятые доли секунды. Каждый раз Google пролистывает миллиарды веб-страниц и выбирает именно те, которые точнее соответствуют запросу пользователя. Суммарное время всех упомянутых мною поисков заняло примерно полторы минуты.

Google была создана в 1998 году, когда лидером бизнеса поисковых систем была Yahoo!, a AltaVista и Lycos наступали ей на пятки. Но уже спустя два года самой популярной поисковой системой среди постоянных пользователей Интернате стала Google — только потому, что она действует быстрее и предоставляет самые точные результаты поиска. Способ же, которым она этого добивается (пролистывая при каждом запросе три миллиарда веб-страниц), построен на мудрости толпы.

Создатели Google не раскрывают все детали своей технологии, но известно, что сердцевиной системы является алгоритм PageRank, который был описан основателями компании Сергеем Брином и Лоренсом Пейджем в теперь уже легендарной работе 1998 года The Anatomy of a Large-Scale Hypertextual Web Search Engine. PageRank — это алгоритм (метод калькуляции), согласно которому все страницы в Интернете сами решают, какие из них лучше соответствуют критериям заданного поиска. Вот как объясняет это сама Google: PageRank пользуется преимуществами уникальных демократических особенностей Сети, применяя в качестве инструмента организации поиска широчайшую структуру ссылок. По сути, Google интерпретирует ссылку страницы А на страницу Б как голос, отданный страницей А в пользу страницы Б. Google оценивает соответствие страницы критериям заданного пользователем поиска по числу полученных ею голосов. Однако Google учитывает не просто число голосов или ссылок; система анализирует также страницу, отдавшую голос. Голоса, отданные страницами, которые заслуживают доверия, оцениваются выше и помогают определить другие страницы как достаточно надежные.

В эти десятые доли секунды Google сканирует всю Всемирную сеть, чтобы решить, какая из ее страниц содержит наиболее полезную информацию, и страница, получившая большинство голосов, помещается на первое место в итоговом списке. И эта страница или стоящая в списке сразу за ней чаще всего оказывается именно той, в которой содержится самая ценная информация.

В настоящее время система Google — это республика, но не идеальная демократия. Как гласит описание, чем больше людей обращаются к странице, тем больше повлияет эта страница на окончательное решение. Заключительное голосование — это "взвешенное среднее" (так же, как курс акции или разброс результатов игр НФЛ), отличающееся от простого среднего, как в случае с оценкой веса каких-то предметов. Тем не менее крупные порталы, имеющие большее влияние на окончательный вердикт толпы, получают его лишь благодаря голосам, которые отдали им мелкие сайты. В противном случае релевантность поиска Google не оказалась бы столь высокой. Итак, и здесь правит толпа. Мудрость на вершине системы обеспечивается разумностью по всей ее вертикали.

5

Если возможность делать ставки на результаты спортивных игр в конечном итоге ведет к созданию механизма, успешно предсказывающего итоги состязаний, возникает закономерный вопрос: будут ли ставки на другие события так же успешны, если исход предскажет группа? Зачем ограничивать себя информацией о шансах команды Лос-Анджелеса против команды Сакраменто, если есть способ узнать, какова вероятность, скажем, у Джорджа Буша обойти на президентских выборах Джона Керри?

Перейти на страницу:

Похожие книги