Лев Ительсон - Лекции по общей психологии
В.М. Бехтерев полагал, что все формы поведения, усваиваемые в течение жизни животными и людьми, могут быть объяснены такого рода «сочетательными» двигательными рефлексами.
Однако, это не так. Если присмотреться, то можно обнаружить, что описанный тип условных рефлексов (иногда его называют «классическим») не объясняет многое даже в обучаемом поведении животных.
Ну что ж, посмотрим, что новое может усвоить животное с помощью этого типа условных рефлексов?
Возьмем классические опыты И.П. Павлова. У собаки выделяется слюна при зажигании лампочки. До выработки рефлекса такой реакции не наблюдалось. Значит, в результате «обучения» в качестве сигнала к запуску реакции выступает новый раздражитель. Тем самым «освоена» новая связь явлений окружающего мира, которая не предусмотрена врожденными программами животного.
Ну, а сама реакция, т.е. выделение слюны? Эта реакция является врожденным ответом животного на раздражение, сигнализирующее пищу.
То же самое мы видим в опытах Бехтерева. Отдергивание ноги при болевом раздражении — это безусловный рефлекс. Козел не учился ему, это — врожденное действие. А чему он научился? Производить эту врожденную реакцию по новому, не врожденному сигналу — вспышке лампочки.
Значит, при помощи классического условного рефлекса можно извлечь из животного только то поведение, которое у него уже есть, врожденное поведение.
Возникает вопрос, а как же животное усваивает новые действия, новое поведение? Например, как медведи у Филатова научаются ездить на велосипеде? Ведь явно такого врожденного поведения у них нет, в репертуаре безусловных их рефлексов соответствующих действий найти невозможно.
Как же возникают такие новые системы поведения? Иначе говоря, как «научается» животное новым реакциям, не содержащимся в его врожденных программах?
Исследования американского психолога Б.Ф. Скиннера показали, что в основе такого рода научения новым видам поведения лежит другой тип условных рефлексов, получивших название «инструментальных» или «оперантных».
«Оперантные» в переводе означает деятельные, действенные, такие, которым научаются с помощью действий.
Приведем пример формирования оперантного условного рефлекса.
Голодную крысу помещают в клетку. В клетке имеется у стенки педаль. Если на эту педаль нажать, то открывается окошечко и в нем появляются маленькие таблетки спрессованного мяса. Голодная крыса мечется по клетке, толкается во все углы. Совершенно случайно однажды она нажимает на эту педаль. Педаль срабатывает, и появляются таблетки пищи — подкрепление. Крыса, разумеется, ее поедает, но пока никакой связи не образуется. Она продолжает бегать, прыгать и метаться. Вот второй раз она случайно натолкнулась на педаль и опять получила пищу. Она продолжает метаться, но уже довольно скоро возвращается к педали опять. Что происходит дальше, нам уже известно из опытов по научению путем проб и ошибок. После нескольких десятков подкреплений крыса, как только голодна, направляется к педали, нажимает на нее и получает пищу.
Это и есть схема образования оперантного рефлекса. Обратите внимание, в чем его особенность по сравнению с классическим — здесь закрепляются не только врожденные, а любые случайные действия животного, которые получили подкрепление. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе — животное само активно ищет правильное действие, и когда его находит, то оно его усваивает.
Другое кардинальное различие: классический условный рефлекс не помогает животному найти решение задачи. Зажглась лампочка — начала выделяться слюна. А есть ли от этого какая-нибудь польза для собаки? Никакой! Но вот, если собака научилась, нажимая на педаль, получать пищу, то от этого есть ей польза. Иначе говоря, оперантный рефлекс представляет собою механизм отбора полезных действий, научения полезным действиям, формирования целесообразного поведения.
Не всегда, правда, эти действия оказываются полезными. Вот, например, как ребенок научается сосать палец. Это тоже — чисто оперантный рефлекс. Ребенок манипулирует руками, ногами, он кусает, хватает все на свете. Однажды он совершенно случайно сунул палец в рот, начал его сосать и получил приятное ощущение. Он его и в нос сует, и в ухо сует, и куда угодно, но ощущений приятных не получает. А вот опять в рот попал палец — снова приятно. Почему приятно? Всякое удовлетворение инстинкта сопровождается приятным чувством. Это природа в нас встроила такой индикатор, чтобы мы стремились удовлетворять инстинкты. Один из первых инстинктов ребенка — сосание материнской груди, поэтому в этот период оно сопровождается для ребенка приятным чувством. Палец является для него как бы моделью эвокатора, он его сосет и получает удовольствие. Так закрепляется это действие, и ребенок начинает сосать палец. Некоторые психологи утверждают, что потом отдаленные остатки этого рефлекса проявляются в склонности к курению — сосать папиросу.
Между прочим, Скиннер утверждает, что механизм оперантных рефлексов лежит также в основе всех наших суеверий. Однажды, например, случайно совпала неприятность с тем, что черная кошка перешла дорогу, и черная кошка стала тормозным сигналом.
Скиннер даже демонстрировал экспериментально этот процесс «формирования суеверий» у голубей. На столе помещался ручной голубь и перед ним белый круг.
Голубь должен этот белый круг клюнуть, и тогда он получает несколько зерен. Когда этот рефлекс выработался, вводится маленький вариант в подкрепление. Когда голубь на ходу случайно поднимает голову, ему сейчас же дают пищу. Когда же идет с опущенной головой, ему пищи не дают.
Через несколько десятков повторений голубь движется к кругу, всегда горделиво задрав голову. У него как бы возникла связь между поднятой головой и получением пищи. В действительное™, такой связи нет. Но для него, т.к. это действие сопровождалось несколько раз получением пищи, такая связь внутренне возникла. Вот точно так же, считает Скиннер, возникает для человека, например, оперантная связь между тем, что он помолился и ему повезет в жизни и т.п. Т.е. действия здесь управляются не объективной связью реальности, а случайным совпадением их с приятным или неприятным событием в личном опыте.
Как можно измерить силу оперантного рефлекса? Сила условного рефлекса измеряется, как вы помните, по силе реакции: если выделилось 15 капель слюны, рефлекс сильнее, чем если 10 капель и т.п. В операн-тном рефлексе сила реакции не служит показателем силы рефлекса. Например, голубя можно научить и быстро бегать и медленно, так что его быстрота бега — это не показатель силы оперантного рефлекса. Показателем силы для него является частота соответствующего действия или частота условной реакции.
Например, голубя приучили, что когда он клюнет по белому диску — появляется зернышко. Можно подсчитать, сколько раз за час голубь клюнул по этому белому диску. Количество таких клевков-реакций и будет характеризовать силу рефлекса. Так, в некоторых опытах Скиннера голубь делал за час до 6000 ударов клювом по кругу, прямо как пулеметная дробь.
Используя этот индикатор, удалось установить, что в отношении к оперантным рефлексам справедливы все законы классического условного рефлекса, т.е. генерализация, дифференцировка и угасание неподкрепленного рефлекса.
Но имеют место и некоторые дополнительные законы. Один из них Скиннер назвал законом промежуточных подкреплений. Он заключается в том, что для сохранения оперантного рефлекса его, оказывается, со-всем не нужно непрерывно подкреплять. Например, голубь может сделать сотню «пустых» клевков. Но, если на каждом сто первом мы ему подложим зернышко, то сила рефлекса сохранится. Вот это отношение между подкрепляемыми и неподкрепляемыми действиями, при котором оперантный рефлекс не обнаруживает угасания, Скиннер назвал отношением подкрепления, или пропорцией подкрепления. А для голубя даже пропорция 1/100 вполне достаточная. Скиннер считает, что этот механизм промежуточного подкрепления проявляется и у человека. Например, в азартных играх или лотерее человек 100 раз покупал билет и 1 раз выиграл. Это его уже подкрепляет, чтобы еще 100 раз купил. Это же промежуточное подкрепление, по его мнению, лежит и в основе суеверий. Сто раз у человека не совпадает встреча с черной кошкой и с неприятностью, а один раз совпала. И этого уже достаточно, чтобы еще сто несовпадений на него не действовали, а он ждал сто первого. Неприятностей же у каждого человека немало. Потому шансов, что рано или поздно одна из них совпадет со встречей черной кошки, достаточно, и суеверие подкрепляется.
Второй очень интересный механизм, который был обнаружен еще Павловым, это — явление вторичного подкрепления. Заключается оно в том, что подкрепленный раздражитель, или условный раздражитель сам, в свою очередь, может становиться подкреплением для другого индифферентного раздражителя.