Чтобы сопоставить уникальную аналогию Селфриджа с концепцией подбора шаблонов, нужно просто представить, что каждый демон держит в руках свою сетку чисел, которая представляет собой форму его буквы. Они перемножают свою сетку с изображением, суммируют эти продукты (как описано выше) и кричат с громкостью, определяемой этой суммой. Селфридж не дает подробного объяснения, почему он решил дать такое демоническое описание визуальной обработки. Единственное, что он говорит по этому поводу, - это: "Мы не собираемся извиняться за частое использование антропоморфной или биоморфной терминологии. Они кажутся полезными словами для описания наших понятий".

Большая часть представлений в презентации Селфриджа была связана с тем, что подход к подбору шаблонов несовершенен. Демоны, каждый из которых по отдельности проверял, есть ли в поле зрения его любимая буква, были не очень эффективны. Каждый из них выполнял свои совершенно отдельные вычисления, но так не должно было быть. Многие фигуры, которые демон может искать в поисках своей буквы, используются и другими демонами. Например, и демон, предпочитающий букву "А", и демон, предпочитающий букву "Н", будут искать горизонтальную полоску. Так почему бы не ввести отдельную группу демонов, чьи шаблоны и крики соответствуют более базовым характеристикам изображения, таким как горизонтальные полосы, вертикальные линии, наклонные линии, точки и т. д. Тогда буквенные демоны будут просто слушать этих демонов, а не смотреть на сами изображения, и решать, как сильно кричать, в зависимости от того, кричат ли об основных формах их буквы.

Снизу вверх Селфридж определил новый стиль стадиона, который содержал три типа демонов: "вычислительные" (те, что смотрят на изображение и кричат об основных формах), "когнитивные" (те, что слушают вычислительных демонов и кричат о буквах) и "решающие" (те, что слушают когнитивных демонов и решают, какая буква присутствует). Селфридж дал название всей модели в целом - этой стопке вопящих демонов - Пандемониум5.

Если не принимать во внимание гнусную номенклатуру, интуиция Селфриджа в отношении обработки визуальной информации оказалась весьма проницательной. Хотя концептуально прост, подбор шаблонов практически сложен. Количество необходимых шаблонов растет с увеличением числа объектов, которые вы хотите обнаружить. Если каждое изображение нужно сравнивать с каждым фильтром, то вычислений будет очень много. Шаблоны также должны более или менее точно соответствовать изображению. Но из-за огромного количества различных световых картин, которые один и тот же объект может создавать на сетчатке глаза или объективе камеры, практически невозможно определить, как должен выглядеть каждый пиксель изображения при наличии того или иного объекта. Поэтому шаблоны очень сложно разрабатывать для любых, кроме самых простых, паттернов.

Эти проблемы делают подбор шаблонов сложной задачей как для искусственных зрительных систем, так и для мозга. Однако идеи, представленные в Pandemonium, представляют собой более распределенный подход, поскольку признаки, обнаруженные вычислительными демонами, являются общими для всех когнитивных демонов. Подход также является иерархическим. То есть Pandemonium разбивает проблему зрения на два этапа: сначала ищем простые вещи, затем - более сложные.

Вместе эти свойства делают систему в целом более гибкой. Например, если Pandemonium настроен на распознавание букв первой половины алфавита, то он вполне сможет распознать и остальные. Это связано с тем, что низкоуровневые вычислительные демоны уже знают, из каких базовых форм состоят буквы. Когнитивному демону новой буквы нужно будет просто понять, как правильно слушать демонов ниже него. Таким образом, элементарные признаки работают как словарь - или набор строительных блоков, - которые можно комбинировать и рекомбинировать для обнаружения дополнительных сложных паттернов. Без такой иерархической структуры и совместного использования низкоуровневых признаков базовый подход к подбору шаблонов должен был бы создавать новый шаблон для каждой буквы с нуля.

Перейти на страницу:

Похожие книги