Под тактиками подразумевалось следующее: (1) встречаемость ситуации, (2) встречаемость связи, не давшей результатов, (3) вознаграждение и (4) наказание. Вознаграждение, которое для того времени правильнее было бы назвать «подкреплением», в большинстве экспериментов заключалось просто в том, что экспериментатор говорил «правильно» на ответ испытуемого, хотя в некоторых случаях это могла быть и некая материальная награда вкупе с чисто символическим поощрением. Наказание обычно означало, что экспериментатор на ответ испытуемого говорил: «Неправильно». Мне не приходит в голову ни один случай в серии экспериментов, когда бы наказание было более серьезным.
Простая встречаемость ситуации без ясно выраженных связей, как оказалось, вызывала небольшие изменения или совсем не вызывала изменений в вероятностях реакции. Опытный вариант испытания включал в себя тест, когда испытуемый должен был с завязанными глазами рисовать линии конкретной длины — 3 дюйма, 4 дюйма, 5 дюймов, — но не должен был указывать, какова длина нарисованной им линии. При таких условиях не наблюдалось систематических изменений ни в средней длине, ни в вариабельности нарисованных линий.
Изучавшийся тип связи можно проиллюстрировать таким примером: испытуемый должен был показывать какую-то цифру от 1 до 5 в ответ на слово-стимул, произносимое экспериментатором, например, на слово «картошка». Если этот тест не давал никакого результата, изменение вероятности было очень умеренным. Вероятность того, что испытуемый скажет «5» в следующий раз, когда снова услышит слово «картошка» (если он уже называл цифру «5» раньше), была выше случайной, но лишь незначительно выше. Ответ, за которым следовало поощрение (вознаграждение), явно усиливался в том смысле, что вероятность повторяемости этого ответа впоследствии заметно возрастала. Оказалось также, что усиление как бы несколько «размывалось» в направлении связи предшествовавшей и связи следующей за той, что получила поощрение — феномен, который называется «распространением эффекта», — и этот феномен интерпретировался как демонстрация непосредственного биологического эффекта поощрения. Степень поощрения значения не имела, и в самом деле, неожиданно сильное поощрение в некоторых случаях оказывало разрушающее воздействие на процесс научения вместо того, чтобы оказать особо значимый эффект.
Исследования показали, что научение происходит, хотя довольно медленно, даже в тех случаях, когда индивиду неизвестно, какой элемент в целом комплексе обстоятельств вызывает поощрение со стороны экспериментатора. В качестве примера могу рассказать об одной серии тестов, в которой я принимал непосредственное участие.
В начале декабря мне дали задание купить рождественские открытки всех видов, какие только я смогу найти в магазинах Нью-Йорка, по 4 открытки каждого вида. Эти открытки явились опытным материалом для тестов, с помощью которого было возможно вознаградить испытуемого за указание на некую не очень приметную деталь, встречающуюся в ряде различных почтовых карточек. В тот раз в качестве такого критерия для поощрения было выбрано наличие золотой краски в цветовой гамме открытки. Если экспериментатор поощрял выбор испытуемых, говоря: «Да, мне тоже нравится эта открытка», испытуемые начинали чаще выбирать такие открытки, в оформлении которых использовалась золотая краска, не сознавая при этом, что эта краска является основанием для их выбора, но это был медленный и долгий прогресс. Он немного напоминал эксперименты Скиннера, где голубей вознаграждали за то, что они крутились в кольцах или совершали какие-нибудь другие действия, которые казались совершенно не связанными с конечной для голубей целью — получением корма[14].
Возможно, наиболее удивительным результатом программы исследований научения, по крайней мере, в том, что касалось моего отца, явилось обнаружение того, что в этой экспериментальной парадигме наказание имело лишь малый ослабляющий эффект или вообще не оказывало ослабляющего эффекта. Кстати, подкрепление в результате образования связи, как оказалось, более чем компенсировало любое ослабление в результате образования связи, ведущей к наказанию. Был сделан вывод о том, что любой эффект наказания зависит от того, какие ответные действия испытуемых он сразу же вызывает. Если индивиды способны в тот же момент сделать что-то другое и получить за это действие поощрение, это означает, что они научаются, но научение имеет место исключительно благодаря поощрению, а не как результат предыдущего наказания.