Первые попытки автоматизировать зрение появились еще до появления современных компьютеров. Хотя они были реализованы в виде механических приспособлений, некоторые идеи, лежавшие в основе этих машин, подготовили поле для последующего появления компьютерного зрения. Одной из таких идей был подбор шаблонов.
В 1920-х годах Эмануэль Гольдберг, русский химик и инженер, решил проблему, с которой столкнулись банки и другие офисы при поиске документов файловых системах. В то время документы хранились на микрофильмах - полосках 35-миллиметровой пленки, содержащих крошечные изображения документов, которые можно было проецировать на большой экран для чтения. Порядок расположения документов на пленке был мало связан с их содержанием, поэтому поиск нужного документа - например, аннулированного чека конкретного клиента банка - был связан с неструктурированным поиском. Чтобы автоматизировать этот процесс, Голдберг прибег к грубой форме "обработки изображений".
Согласно плану Голдберга, кассиры, вносящие новый чек в систему учета, должны были пометить его специальным символом, указывающим на его содержание. Например, три черные точки в ряду означали, что имя клиента начинается с буквы "А", три черные точки в треугольнике - что с буквы "Б" и так далее. Теперь, если кассир хотел найти последний чек, предъявленный, например, мистером Беркширом, ему нужно было просто найти чеки, помеченные треугольником. Таким образом, шаблон треугольника был шаблоном, и задача машины Голдберга состояла в том, чтобы соответствовать ему.
Физически эти шаблоны имели форму карточек с пробитыми в них отверстиями. Так, при поиске документов мистера Беркшира кассир брал карточку с тремя отверстиями в форме треугольника и помещал ее между лентой микрофильмов и лампочкой. Затем каждый документ на ленте автоматически подтягивался к карточке, в результате чего свет проникал через отверстия на карточке, а затем и через саму пленку. Фотоэлемент, расположенный за пленкой, фиксировал любой проходящий свет и сигнализировал об этом остальным частям машины. Для большинства документов свет проникал через пленку, так как символы на пленке не совпадали с отверстиями на карте. Но когда появлялся нужный документ, свет, проникающий через карточку, полностью блокировался узором из черных точек на пленке. Эти мини-затмения означали, что свет не попадает на фотоэлемент, и это сигнализировало остальным частям машины и кассиру, что совпадение найдено.
Подход Голдберга требовал, чтобы кассиры заранее знали, какой именно символ они ищут, и имели карту, соответствующую ему. Несмотря на свою грубость, этот стиль подбора шаблонов стал доминирующим подходом на протяжении большей части истории искусственного зрения. Когда на сцене появились компьютеры, форма шаблонов перешла из физической в цифровую.
В компьютере изображение представлено в виде сетки значений пикселей (см. рис. 14). Каждое значение пикселя - это число, указывающее на интенсивность цвета в крошечной квадратной области изображения, которую оно представляет.3 В цифровом мире шаблон - это тоже просто сетка чисел, определяющая нужный шаблон. Так, шаблон для трех точек в форме треугольника может представлять собой сетку, состоящую в основном из нулей, за исключением трех точно расположенных пикселей со значением 1. В машине Голдберга роль света, проходящего через карточку-шаблон, в компьютере была заменена математической операцией: умножением. Если значение каждого пикселя на изображении умножить на значение в том же месте шаблона, результат может сказать нам, совпадает ли изображение.