Действительно, предположим, что в качестве второго параметра мы избрали нечто, совершенно не содержащее малейшего намека на принадлежность ребенка той или иной группе — скажем, номер квартиры, в которой он проживает. В этом случае наш график будет выглядеть следующим образом: ближе к началу координат вертикальной полосой расположатся зеленые точки, к ней будет примыкать и частично пересекаться же полоса зеленых точек. Часто будет наблюдаться такая ситуация: точка близка «своему» центру по существенному параметру — росту, но сильно удалена по значению параметра несущественного — номеру квартиры. В результате различие в расстояниях от нее до каждого из центров станет незначительным, а из-за небольшой даже разницы средних значений второго параметра в двух группах возможны неправильные отнесения. Введение второго, несущественного параметра, таким образом, ухудшает качество предсказания «Под влиянием таких параметров может происходить разнесение объектов одного класса и сближение объектов разных классов. Это явление лежит в основе так называемой „теоремы о гадком утенке“… (Ее доказательство и название принадлежит японскому ученому Ватанабэ. — С. Г.). Своим названием теорема обязана одному из ее частных следствий, согласно которому в таком пространстве расстояние между гадким утенком и лебедем будет таким же, как между двумя лебедями». Это цитата из книги А. Б. Розенблита и В. Е. Голендера «Логико-комбинаторные методы в конструировании лекарств» — несомненно, одной из лучших на русском языке монографий по проблеме анализа связи структура — активность. Книга эта, написанная на самом современном научном уровне, доступна тем не менее во многих частях также и непрофессионалам. Кроме того, ее очень украшают встречающиеся там и сям симпатичные искорки юмора. Пример — прямо на второй странице: «Тираж 300 экземпляров»; естественно, было бы просто издевательством отсылать к ней читателя, желающего глубже ознакомиться с этими вопросами.

Непосредственная связь с магией

Не счесть всех постыдных поражений и глупейших конфузов, кошмарных провалов и опереточных таки ошибок, выпавших на долю тех мужественных и изобретательных людей, которые впервые взялись за внедрение методов теории распознавания образов в различных прикладных областях.

Социология, лингвистика, экономика, геология, ботаника — где только не пробовали они свои силы; как мы знаем, в фармакологии и токсикологии тоже. Их приход в каждую из этих областей встречался сначала с большим энтузиазмом, затем следовали первые результаты — и они решительно всех разочаровывали. ЭВМ, напичканная массой всяческой информации и снабженная программами, в которых реализовались мудреные алгоритмы, с трудом отличала, образно говоря, зайца от барашка (есть абхазская пословица: «Похож, как заяц на барашка») и уж полностью была бессильна в ситуациях менее очевидных, хотя все еще тривиальных с точки зрения специалистов. В шестидесятые годы, когда происходило становление теории распознавания образов, часто с эстрады звучала басня о некоем незадачливом руководящем Медведе, привыкшем подбирать кадры исключительно на основании анкеты:

…Рассмотрим данные, картина такова:Ноги четыре, уха два,Шерсть тона светлого, длинней всего на холке.Имеет хвост, украшенный метелкой,Способен оглушительно реветь…«Так это ж лев!» — разинул рот медведь.

При ближайшем рассмотрении обладатель анкеты оказался ослом. В этой истории, как в капле воды, отражены неприятности, подстерегающие авторов распознающих программ; в частности, сразу бросается в глаза использование малоинформативных признаков: «ноги четыре» и в особенности «уха два».

За прошедшие с тех пор два с лишним десятилетия теория распознавания образов значительно шагнула вперед, и во многих сферах использование ее методов для решения различных прикладных задач стало повседневной практикой. К сожалению, этого нельзя пока сказать о задачах выявления связи структура — активность, хотя и на этом пути достигнут определенный прогресс.

Один из важнейших уроков истории развития методов теории распознавания образов заключается, по-видимому, в выводе, что нет надежд на получение универсальных, пригодных в равной степени для всех задач методов; каждый узкий класс задач требует создания строго ориентированных процедур, учитывающих специфику задачи. Даже при исследовании проблемы связи структура — активность наметилось несколько направлений, требующих развития различных подходов в зависимости от поставленных целей и круга изучаемых соединений; при этом именно в силу специфики задачи некоторые из них выходят за традиционные рамки методов теории распознавания образов.

Рассмотрим подробнее в качестве примера так называемый логико-структурный подход к изучению связи структура — активность, развиваемый упоминавшимся А. Б. Розенблитом и В. Е. Голендером.

Перейти на страницу:

Все книги серии Эврика

Похожие книги