Первые бихевиористы, особенно Ватсон, считали
объяснения поведения, с точки зрения инстинктов,
бесплодными и были крайне нетерпимы по отно-
шению к существующему интроспективному мето-
ду, который представлял сомнительные результаты
и был бесполезен при работе с детьми и животны-
ми. Метод Павлова оказал влияние на Ватсона
и сторонников теорий обучения своей объектив-
ностью и экспериментальной точностью. Павлов
объяснял поведение с позиций теории обучения,
допуская существование безусловных рефлексов в
минимальном количестве и описывая исключитель-
но наблюдаемое поведение, а также и его физиоло-
гические механизмы.
Теория обучения, выдвинутая Гатри в 1935 г.,
была наиболее близкой тому, как Ватсон воспринял
систему Павлова. Эта теория провозглашала про-
стую взаимосвязь между реакцией, понимаемой как
деятельность или секреция желез, и любым стиму-
лом или их комбинацией, как основной закон
обучения. Мотивация при этом была совершенно не
важна. Реакции на различные сигналы, внутренние
или внешние, у голодного животного отличаются от
реакций сытого животного. Вознаграждение совер-
шенствует поведение не в качестве должного ответа,
а потому что оно завершает данную серию дейст-
вий, и, таким образом, предохраняет связь между
собой и любой последней деятельностью животного
от разрушительного влияния других действий. С
этой точки зрения, “бесцельное поведение” не
представляет трудности для объяснения. Изобрета-
тельный Гатри использовал ее также для объясне-
ния определенного действия.
Теория Халла - самая влиятельная теория обу-
чения в англоязычных странах - разделяла пред-
положения Торндайка, что поощрение важно при
обучении (173). Типичное обучение кошек методом
“проб и ошибок” проявилось в “черных ящиках”
Торндайка, представляющих собой выбор образца
для обучения, в соответствии с методикой проведе-
ния тренировки по Павлову. Сначала кошки двига-
лись наугад, случайно нажимая рычаг, который
открывал выход из клетки к пище и свободе.
Нажатие на рычаг после ряда успешных попыток
постепенно совершенствовалось. Торндайк описы-
вает это, допуская, что связи между стимулом в
этом “черном ящике” и реакцией усиливались,
благодаря вознаграждению.
Тщательно разработанная гипотеза Халла, ко-
торая основана на экспериментах, поддающихся
контролю, была гораздо более продуманной и
точной. Она предполагала, что поощрение необхо-
димо для обучения. Поведение мотивируется пер-
вичными побуждениями, т. е. физиологическими
потребностями, такими, например, как голод, вы-
зывающими сильные внутренние стимулы. Поощре-
ние заключается в уменьшении степени побужде-
ния, вызванного физиологическими потребностями
и стимулами, которым они дали толчок. Типовые
эксперименты состояли в том, что голодные крысы
бегали по клеткам, построенным в форме лабирин-
тов, которые заканчивались отсеками, содержащими
пищу. Чувство голода, измеряемое временем, в
течение которого крыса была лишена пищи, и
вознаграждение, в виде получения пищи, в конце
лабиринта имеют существенное значение в его
изучении. Пища снижает побуждение голода, и,
таким образом, усиливает связь между сигналами
(их расположение, яркость и т. д.) нужного пути
и реакцией в виде бега, которая является спосо-
бом для получения пищи. Какого-то изначально
совершенно безобидного сигнала, если он сопро-
вождается болью, было достаточно, чтобы приду-
мать новый способ избегать его.
Таким образом, можно изучить основную массу
“вторичных” побуждений (248). Похвала, деньги или
игрушки - вторичные побуждения, которые стали
эффективными после обучения, основанного на
уменьшении первичных побуждений. Ребенок учится
подражать своим родителям и более старшим детям,
сравнивая свое поведение с поведением более стар-
ших и сильных, что приводит его к успеху гораздо
чаще, чем раньше (247). Длительный период детства
человека, во время которого его потребности удов-
летворяются матерью или близкими людьми, рож-
дает вторичные мотивы, которые делают более эф-
фективными вербальные и социальные стимулы.
Сначала необязательно поощрять ребенка всякий
раз, когда он занят какой-либо деятельностью. До-
статочно и того, что есть какие-то внешние знаки
или внутренние стимулы, связанные изначально с
уменьшениями побуждения. Стимулы, производи-
мые собственными реакциями животных, могут за-
нимать промежуточное положение, действуя как сиг-
налы к поощрению (273). По этой теории, такое
поведение, как игра, т. е. то, которое имеет место
без видимого поощрения, объясняется как поведе-
ние, возобновленное вторичными сигналами, кото-
рые приобретены в результате обучения и симво-
лизируют поощрение, вызванное опосредованными
стимулами, производимыми собственными реакция-
ми животных.
В своей теории Скиннер (331) сформулировал
законы, описывающие различия друг от друга сти-
мулов, реакций и поощрений (подкреплений), и их
отличие от механизмов, с помощью которых прохо-
дило обучение. Он разграничивал реакции, вызы-
ваемые стимулами, и поведение “операнта”, которое
бывает всегда, но формируется избирательным под-
креплением. Скиннер показал, что один из факто-
ров, который поддерживает привычку ходить, -
это тип и время использования подкрепления в
обучении (113), особенно, если оно имеет неодина-
ковые промежутки (что трудно предугадать обучае-
мому).
Любая птица, обученная ударять по клавише,
после чего на кажый клевок появляется пища,
быстро остановится, если пищевого подкрепления
больше не последует. Однако, если пища подава-
лась через неравные промежутки времени, птица
продолжает клевки гораздо дольше. Это навело на
мысль о формировании поведения в детстве. Роди-
тели не могут подкреплять (похвала, вознагражде-
ние) любое случайное поведение. Видимо, “невоз-
награждаемое” поведение может быть просто пове-
дением, которое ранее поощрялось нерегулярно. С
другой стороны, поощрения, даваемые регулярно
через короткие промежутки времени безотноситель-
но к текущему поведению, вызывают странные и
бессмысленные реакции. Так, голодные птицы по-
лучали кусочки пищи регулярно через короткие
промежутки времени безотносительно к тому, что
они делали. Получалось, что любое действие птицы
во время появления пищи выступало как бы в ка-
честве условного раздражителя к ее появлению.
К окончанию эксперимента одни птицы наклоня-
ли, другие поднимали головы, ожидая пока поднос
с пищей не появится вновь, и продолжалось это
непрерывно более 10000 раз, до того как реакция
исчезнет (330). Вероятно, некоторые игры развива-
лись и этим путем.


Leave a comment