Однако закону Бенфорда подчиняются не все списки чисел. Например, телефонные номера обычно начинаются с определенного кода, соответствующего региону. Даже таблицы квадратных корней не подчиняются этому закону. С другой стороны, не исключено, что если собрать все числа, появившиеся в передовицах нескольких местных газет в вашем городе за неделю, они будут распределяться по этой формуле. Но почему же так получается? Что общего у городского населения в штате Массачусетс со смертностью от землетрясений во всем мире и с числами из статей в «Readers Digest»? И почему этому же правилу подчиняются числа Фибоначчи?

Строго доказать закон Бенфорда математическими методами оказалось совсем не просто. Одним из главных препятствий стал именно тот факт, что подчиняются этому закону не все перечни чисел – и даже приведенные примеры из ежегодника «World Almanac» не вполне ему соответствуют. В статье об этом законе в журнале «Scientific American», опубликованной в 1969 году, математик Ральф А. Райми из Рочестерского университета сделал вывод, что «ответ остается неясным».

Объяснить этот закон удалось лишь в 1995–1996 годах, и сделал это математик из Технологического института в Джорджии Тед Хилл. Хилл заинтересовался законом Бенфорда в начале девяностых, когда готовил доклад о сюрпризах вероятности. Вот как он вспоминал об этом в беседе со мной: «Я начал работать над этой задачей для развлечения, однако многие коллеги предупреждали меня, что надо быть осторожным, поскольку закон Бенфорда вызывает наркотическое привыкание». После нескольких лет работы Теда наконец осенило, что не нужно рассматривать числа из одного конкретного источника: главное – это смесь данных. Хилл переформулировал закон Бенфорда статистически в новой форме: «Если распределения подбираются случайно (любым непредвзятым способом) и из каждого распределения выбираются случайные образцы, то частота встречаемости цифр на значимом месте в смеси образцов сходится к распределению Бенфорда, даже если некоторые отдельные выбранные распределения не подчиняются этому закону». Иными словами, предположим, что вы собрали случайный набор чисел из мешанины распределений – например, из таблицы квадратных корней, таблицы смертности в сенсационных авиакатастрофах, населения округов и расстояний между теми или иными городами на планете по воздуху. Некоторые эти распределения сами по себе не будут подчиняться закону Бенфорда, но Хилл доказал, что чем больше вы соберете подобных чисел, тем ближе встречаемость цифр в этих числах будет к предсказанной законом Бенфорда. Так почему же этому закону подчиняются и числа Фибоначчи? Ведь они-то строго определены рекурсивным соотношением, это не случайные образцы из случайных распределений.

Так вот, в этом случае выясняется, что соответствие закону Бенфорда свойственно не только числам Фибоначчи, но и другим подобным последовательностям. Если исследовать большой массив различных степеней двойки (21 = 2, 22 = 4, 23 = 8 и т. д.), станет видно, что они тоже подчиняются закону Бенфорда. Удивляться этому не следует, если учесть, что сами по себе числа Фибоначчи – это степени золотого сечения (вспомним, что n-ное число Фибоначчи близко к φn/√5). В сущности, можно доказать, что закону Бенфорда подчиняются последовательности, заданные большим классом рекурсивных соотношений.

Закон Бенфорда – очередной поразительный пример того, как чистая математика превращается в прикладную. В числе прочих занятных способов применения этого закона – выявление подделки и фабрикации данных в бухгалтерии и при уклонении от налогов. Данные из самых разных финансовых документов всегда очень хорошо соответствуют закону Бенфорда. А сфабрикованные данные – очень редко. Хилл доказал, как работает этот метод выявления мошенничества, на одном простом примере при помощи теории вероятности. На первом занятии своего курса по теории вероятностей Хилл просит студентов провести эксперимент. Если девичья фамилия их матери начинается с букв от А до L, они должны подбросить монетку 200 раз и записать результат – сколько было орлов и сколько решек. Остальным студентам предлагается подделать результат 200 бросков монетки, то есть создать случайную последовательность орлов и решек. На следующем занятии Хилл собирает результаты и очень быстро определяет, где результат подлинный, а где поддельный, и в 95 % случаев не ошибается. Как ему это удается? В любой последовательности из 200 бросков монетки, если ее действительно бросали, с большой вероятностью попадается по шесть орлов или шесть решек подряд. А когда кто-то пытается подделать последовательность из 200 бросков монетки, им кажется, что такого уж точно не может быть.

Перейти на страницу:

Все книги серии Золотой фонд науки

Похожие книги