Кроме того, соответствие слов разных языков друг дру­гу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наобо­рот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивален­та.

Такие программы обычно основываются на двух прин­ципах:

1. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, авто­мат может различить эквиваленты глагола "to book" и существительного "book" (соответственно, "резервиро­вать" и "книга").

2. На принципе выбора эквивалента по семантической мо­дели. По разным семантическим моделям автомат, на­пример, может различать такие эквиваленты слова "solution" как "решение" и "раствор". Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны. Мы кратко и в общих чертах рассмотрим их ни­же.

В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивален­тов, работающие по этому принципу, еще сложнее: их от­носят к разряду моделей искусственного интеллекта.

В зависимости от сложности выбора правильного зна-

чения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода мож­но разделить на три уровня.

К первому, низшему уровню относятся простейшие модели пословно-пооборотного перевода, в которых вы­бор эквивалентов не производится и на выход системы перевода поступают все переводные эквиваленты, имею­щиеся в словаре.

Системы второго уровня, к которым относятся почти все так называемые "электронные переводчики", имею­щиеся на современном рынке программного обеспечения, используют ту или иную комбинацию синтаксических и семантических моделей для выбора правильного эквива­лента и преобразования структуры входного текста в структуру текста перевода.

Наконец, модели третьего уровня в дополнение к грамматике и семантике применяют для синтеза текста перевода также и фоновые знания. Надо сказать, что мо­дели и системы этого уровня до сих пор находятся на ста­дии эксперимента.

Для того чтобы яснее представить себе возможности систем разного уровня и качество перевода, которое вы можете получить с их помощью, давайте проведем анало­гию между действиями автомата и человека.

Системы низшего уровня можно сравнить с челове­ком, который, пользуясь словарем и таблицей словоизме­нения (списком правил и форм спряжения и склонения), переводит текст на совершенно незнакомом ему языке,

Система действует так же, как действуем в этом случае мы. Берет первое слово, смотрит, есть ли оно в словаре в таком виде. Если есть, выписывает все его переводы, если нет, то ищет в таблице словоизменения форму слова, об­наруженную в тексте, определяет соответствующую сло­варную форму и выписывает все переводы. Затем берет следующее слово и т.д.

В данном случае отличие от перевода, выполняемого человеком, состоит в том, что человек, делая такой перевод, отбрасывает все неподходящие переводные эквива­ленты, система же машинного перевода низшего уровня этого не делает. Вот какой, например, получается перевод короткого предложения: Lead absorbs radiation

свинец / лот / грузило / вести / руководить / лидировать / руководство / лидерство / проводник; всасывать / впи­тывать абсорбировать / амортизировать / поглощать; излучение/ радиация',

Системы второго уровня по своим действиям напоми-нают более или менее опытного переводчика, который переводит текст на совершенно непонятную ему тему. Подобно такому переводчику система сможет отбросить наиболее неподходящие эквиваленты на основе анализа синтаксиса и семантики, причем глубина и точность такого анализа у автомата будет зависеть от совершенства и пол­ноты моделей так же, как у переводчика, она зависит от полноты его профессиональных знаний.

Но так же, как переводчик, который совершенно не по­нимает содержания переводимого текста, переводящий автомат этого уровня не сможет сделать выбор экви-валентов на основе фоновой информации.

Перейти на страницу:

Похожие книги