Будет справедливо заключить, что большинство людей понимают — то, что задала эта жена своему мужу, вовсе не было задачкой на вычитание. Ничего, что этот вывод может быть абсолютно неверен. (Например, муж мог работать допоздна в своей лаборатории и только что открыть средство от рака, которое принесло бы его семье славу и деньги; или он мог прийти домой слишком рано!) Мы говорим о том, что большинство людей понимают из этой простой истории и чего не понимают компьютерные программы. Чтобы программа поняла эту историю, нужна не только обширная память на идиомы (а иначе как понять выражение «задала мне»), но также некоторое представление о приходах и уходах мужей и о том, каковы убеждения и отношения жен к таким выходкам.

<p><strong>Непрерывное распознавание речи</strong></p>

Системы непрерывного распознавания речи (НРР) — это программы, которые распознают и регистрируют естественную речь. Внешне система НРР кажется достаточно простой для конструирования. В конце концов, большинство людей и некоторые животные распознают и регистрируют определенный тип речи. Однако эта задача крайне сложна по упомянутым выше причинам. Рассмотрим хотя бы проблему, связанную с омофонами, — словами, которые звучат одинаково, но имеют различное значение, например arm («рука») — конечность, прикрепленная к торсу, и arm («оружие») — то, что вы производите, чтобы защитить себя от полуночного злоумышленника. В предложении: Jeff armed himself in the event of an emergency («Джеф вооружился на крайний случай») слово armed означает, что Джеф обзавелся определенным видом оружия. Однако, если вы знаете Джефа, а также то, что в результате несчастного случая он потерял обе руки и теперь пользуется протезами, которые он надевает в крайнем случае, например при пожаре, вы так же знаете, что armed означает, что он надел свою искусственную руку. Как бы система НРР разобралась с этим паттерном речи? Большинство программ работает на основе статистической вероятности и ограниченного синтаксического контекста и, таким образом, неверно истолковали бы смысл предложения. Однако постепенно создаются все более сложные программы, которые учитывают контекст и задействуют «знания о мире».

Исследования на переднем крае НРР связаны с программами перевода, упомянутыми выше. Эти новые программы не просто осуществляют перевод путем «грубого поиска и сравнения», а способны к непрерывному распознаванию речи с использованием полного словаря, переводу на другие языки и синтезу речи с высокой степенью точности. Это означает, что человек может говорить по-английски, например в «телефон» (или микрофон, связанный с компьютером); английская речь переводится в текст; текст переводится на другой язык, например французский; синтезируется речь на втором языке; и в результате мы получаем устную версию переведенного сообщения. Эта удивительно практичная программа уже находится на стадии экспериментальной проверки (см. Kurzweil, 1999), и коммерческий продукт, как ожидается, появится на рынке в начале этого десятилетия.

<p><strong>Программа понимания языка</strong></p>

В процессе разумного общения с человеком NETtalk и CSR используют знания о мире, и то же самое делают другие программы, в спектр деятельности которых включены те или иные формы человеческого понимания. Среди наиболее известных и наиболее спорных — программа понимания языка, разработанная в Йельском университете Роджером Шенком. Разработки Шенка преследовали несколько целей, включая создание программы, способной понимать письменный текст, кратко излагать его суть, переводить его на другой язык и отвечать на вопросы по его содержанию. Шенк и его коллеги скоро обнаружили, что люди понимают гораздо больше, чем просто ряды слов естественного языка. Он иллюстрирует этот момент следующим рассказом: «Джон пошел в ресторан. Он заказал сэндвич. Официант принес его быстро, поэтому он дал ему большие чаевые». Вопрос: съел ли Джон сэндвич? Заплатил ли он за него?

Когда я говорю вам: «Я был в Венеции прошлым летом», — вы можете, в свою очередь, задать мне много вопросов более или менее по существу: потратил ли я сколько-то денег? Летел ли я самолетом? Или плыл на корабле? Говорил ли я с кем-нибудь? Заходил ли я в ресторан? Видел ли я других людей в Венеции? Говорят ли они по-итальянски? Носят ли они одежду? Есть ли у них ногти? Сколько? Чтобы «разумная» машина понимала язык, она должна уметь при обработке языка делать разумные выводы, как это делают обычные люди. Основная идея Шенка близка принципу обработки «сверху вниз», подробно обсуждающемуся в этой книге.

Одной из трудностей, с которой исследователь столкнулся при разработке программы обработки языка, была неоднозначность естественных языков. Шенк (Schank, 1981) приводит следующий пример:

Я ударил Фреда по носу.

Я ударил Фреда в парке.

Перейти на страницу:

Все книги серии Мастера психологии

Похожие книги