Видимо, для сравнения Ф суби Ф субнадо одним ии. предложить размышлять о повторяемости букв, представленных в виде алфавита, т. е. построить опыт так же, как это сделал Эттнив в первой группе своих информантов. Другая же группа ии. должна оценивать повторяемость букв, имея перед собой список, где русские буквы расположены в заведомо случайном по сравнению с алфавитным порядке.
Такой эксперимент провел А. П. Василевич в конце 1960–х годов.
Самый интересный результат в этом эксперименте относится не к тому, что ии. действительно способны дать такие оценки Ф суббукв, которые были бы близки к Ф об, — все же после опытов Эттнива это трудно было бы поставить под сомнение. Более важно другое — оказалось, что ии. имеют совершенно разный "внутренний масштаб" оценок.
Инструкция в эксперименте Василевича предлагала ии. оценить частоту повторяемости букв в тексте длиной 1000 букв. При этом подчеркивалось, что, с учетом числа букв русского алфавита, это значит, что более частые буквы могут встретиться более чем 31 раз, а менее частые — менее чем 31 раз. Но это не помешало ии. дать отдельным буквам такие оценки Ф суб, что их сумма доходила до 1250!
Например, все ии. считают самой частой русской буквой букву а. Здесь Ф субчетко расходится с Ф об- Ибо самой частой русской буквой в текстах, согласно надежной статистике, является о, далее идет е, буква азанимает только третье место.
Впрочем, это не так важно. Более интересно иное: ии. приписывали букве аФ субот 30 до 150! Но зато даже те ии., которые мыслят весьма "размашисто", этот масштаб сохраняюти в оценках других букв.
Отсюда можно сделать любопытный вывод: человек, по–видимому, хорошо предсказывает относительные частоты и куда хуже — абсолютные.
Это, в общем, естественно — ведь для адекватного прогноза нам надо знать именно сравнительную вероятность того или иного события.
Таблица 3
Оценки относительной частоты встречаемости 15 букв русского алфавита
| Буква | Данные опроса (Фсуб) | Данные подсчетов по текстам (Фоб) |
| А | 1 | 3 |
| 0 | 2 | 1 |
| Е | 3 | 2 |
| И | 4 | 4 |
| К | 5 | 14 |
| С | 6 | 9 |
| Н | 7 | 5 |
| Р | 8 | 7 |
| П | 9 | 13 |
| Л | 10 | 10–11 |
| в | 11 | 8 |
| т | 12 | 6 |
| м | 13 | 12 |
| Б | 14 | 19 |
| Д | 15 | 10–11 |
Важно, что стоит на первом месте, а что на пятом, т. е. важно знать порядок, относительный ранг буквы, слога или слова.
О мере адекватности оценок частоты встречаемости букв можно судить по данным табл. 3, где приведены сравнительные данные Ф Суби Ф обдля 15 букв русского алфавита.
3. ОЦЕНКА ЧАСТОТЫ ВСТРЕЧАЕМОСТИ СЛОВ
Выше мы уже говорили о том, что, используя частотные словари, можно так выбрать слова, значение которых надо выучить в первую очередь, чтобы объем абсолютно необходимого словаря–минимума свести к 2,5–3 тыс. наиболее частых слов.
Это, в общем, верный путь. Однако — и это было отмечено в свое время французскими учеными, решавшими сходные практические задачи, — есть частые слова, которые почему–то регулярно не находят себе места в перечне того, что оказывается самым частым по данным частотных словарей.
Например, таково слово
Заметьте, что в тексте "Случай с Оливером" этот феномен отчасти проявился — в список наиболее частых слов не попал ни
Условимся называть обиходнымислова, именующие подобные предметы.
Исследования французских ученых некогда показали, что о многих весьма "обиходных" и важных предметах мы не только не пишем, но и говорим о них редко, поэтому к редким словам, например, относятся