Виктор Аллахвердов - Методологическое путешествие по океану бессознательного к таинственному острову сознания
Но это еще полбеды. За схемой вообще не заметили логической подмены. Успех не может привести к научению – ведь для достижения успеха животное уже должно быть наученным, лишь потом оно может образовывать связи с подкреплением. Подкрепление же в принципе не может ничему научить и даже не может хоть как-то помочь научению. Как ни корми крыс или голубей, они не научатся играть в преферанс. И если, например, животное не способно отличить синий цвет от зелёного или вертикально заштрихованную дверцу от горизонтально заштрихованной, то никаким вознаграждением такую способность не развить. Вот как осторожно о роли подкрепления пишет А. Бандура, дрейфующий от чистого бихевиоризма к когнитивистски окрашенным конструкциям: «Подкрепление представляет собой эффективное средство регуляции уже заученного поведения, но в то же время оно является относительно малоэффективным способом его формирования».[177] Я бы высказался резче: подкрепление вообще не может быть ни способом, ни причиной научения, а играет лишь роль информирующего и мотивирующего начала.
Во-первых, оно дает животным обратную связь о правильности их действий с точки зрения экспериментатора (иначе, например, крысе никак не узнать, что экспериментатор хочет, чтобы она подходила именно к вертикально заштрихованной дверце, а не к какой-нибудь иной). И в этом нет ничего удивительного. Влияние информации о результатах деятельности на процесс научения хорошо известно. Как обнаружил ещё Э. Торндайк, можно несколько тысяч раз нарисовать линию заданной величины, но без контроля зрения и без учёта сделанной ошибки не только нельзя научиться нарисовать правильно, но даже не будет происходить какой-либо стабилизации в размере нарисованных испытуемым линий. Для повышения эффективности в процессе научения, иначе говоря, необходима обратная связь. Среди многочисленных исследований на эту тему отмечу работу Й. Лингарта: дети разного возраста должны были нажатием кнопки реагировать на начало движения секундомера из нулевого положения. В одной группе после нажатия кнопки секундомер сразу останавливался. Во второй – секундомер продолжал двигаться ещё в течение 2-5 сек. Иначе говоря, в первой группе испытуемые могли адекватно оценивать точность своей реакции, во второй – лишь приблизительно. Время реакции в среднем в первой группе намного меньше, чем во второй. И это различие с возрастом только увеличивается.[178] Поэтому же и подкрепление в той мере, в какой оно выступает как информация о результатах деятельности, обязательно будет влиять на научение.
Процесс заучивания не должен, как уже говорилось, принципиально отличаться от процесса научения. Поэтому поклонники теории связи, признающие важнейшую роль подкрепления, с ужасом ссылаются на факты о том, что подкрепление хотя и определяет выбор заучиваемого материала, но почти не влияет на эффективность заучивания. Например, Л. Нильссон предъявлял трем группам студентов один и тот же список слов. Первая группа просто его заучивала. Второй группе обещали большой денежный приз тому, кто вспомнит больше всех слов. В третьей – обещание денежного приза давалось перед началом воспроизведения. Разницы в объеме воспроизведения у этих трех групп не было.[179] Тем не менее большинство (если не все) исследователи уверены, что сенсомоторное научение тем эффективнее, чем выше мотивация (иногда с оговоркой: если мотивация не чрезмерная). Однако не знают, как это доказать, поскольку внешняя стимуляция, которую вводит экспериментатор, далеко не всегда определяет реальную мотивацию поведения человека, а подлинная мотивация с трудом подлежит исследованию – это «очень привлекательный, но ускользающий конструкт».[180] Приводимые примеры (соревновательный эффект обычно, но далеко не всегда, ускоряет научение и т.п.) скорее подчёркивают положительнуюрольобщей активизации организма в процессе научения. Вообще говоря, не удивительно, что исследования над людьми уже не столь однозначно показывают влияние подкрепления на обучение. Просто в экспериментах с человеком подкрепление во многом теряет свою информирующую роль. Ведь человек способен воспринять словесную информацию о критериях оценки эффективности своей деятельности и оценивать результаты своей деятельности, опираясь именно на эти критерии.
Во-вторых, подкрепление служит для умеющих, т.е. научившихся, животных основанием совершать эти задуманные экспериментатором действия. Эту мотивирующую роль подкрепления хорошо демонстрирует эффект Креспи. В экспериментах Л. Креспи (1942 г.) мыши научались бегать по лабиринту и находить кормушку. Одна группа получала у цели 16 зёрнышек пищи, вторая – 66, а третья – 256. Оказалось, что скорость прохождения лабиринта строго соответствует вознаграждению: первая группа бегала медленнее всех, а третья – быстрее всех. Но стоило экспериментатору изменить условия и всем мышам выдавать минимальное подкрепление, как скорость пробежки во второй и третьей группы снизилась до скорости первой.[181]
Подведем итог: надежда на будущее вознаграждение может способствовать тому, что человек начнёт учиться. Эта надежда может также повысить активность субъекта в процессе научения. Получение вознаграждения даст ему понять, что он достаточно хорошо научился. Стремление получить обещанное вознаграждение может побуждать человека делать то, чему он уже научился. Однако никакое вознаграждение само по себе не научит ни играть на скрипке, ни плавать, ни левитировать, ни отличать синее от зелёного. И вознаграждение за пойманного льва получит только тот, кто уже умеет ловить львов, т.е. тот, кто его поймает.
Не удивительно, что научение у животных обнаруживается и без всякого подкрепления. На Западе это явление получило название латентного научения. Считается, что первым феномен латентного обучения обнаружил Х. Блоджетт. Он в течение девяти дней помещал в лабиринт три группы одинаково голодных крыс по одному разу в день. Первой группе подкладывали корм в целевой камере с первого же дня, второй – с третьего, а третьей – с седьмого. Первая группа лишь к четвёртому дню научилась быстро находить целевую камеру. И далее медленно улучшала свои достижения. Но как только крыс второй и третьей группы начинали подкармливать в лабиринте, они почти сразу достигали скорости пробежки первой группы. Отсюда делался вывод: они заранее научились ориентироваться в лабиринте, ещё не получая подкрепления.[182]
В исследовании К. Спенса и Р. Липпитта хорошо накормленные и напоенные водой крысы бегали по U-образному лабиринту. В правом конце лабиринта помещали воду, в левом – пищу. Выпущенные из клетки крысы просто с удовольствием бегали по лабиринту, хотя и не получали никакого подкрепления: когда они находили кормушку, их сразу же возвращали в клетку. Так продолжалось 7 дней. В день проводилось 4 опыта: два опыта с кормушкой в правом конце и два опыта – в левом. В критическом опыте животные были разбиты на две подгруппы: одну их них не кормили, другой не давали пить. Затем их запускали в лабиринт. Голодные крысы чаще с первой же попытки бежали в левый конец, где была пища, а крысы, страдавшие от жажды, также с первой попытки чаще бежали в правый конец, где была вода.[183]
Если животные только наблюдают за действиями своих сородичей, то они способны научиться этим действиям, сами при этом не получая никакого подкрепления. (Подобные явления Л.А. Орбели как раз и называл «подражательным условным рефлексом»). В исследовании М. Херберта и К. Хэрша кошки вращали диск и получали за это пищу. За происходящим следили кошки-наблюдательницы. Когда последних посадили в клетку с диском, то они гораздо быстрее первых научились вращать диск.[184] По утверждению А. Бандуры, у видов, стоящих на высоких ступенях развития, разительно проявляется превосходство научения через наблюдение над научением через подкрепление.[185] Неужели наблюдение за поеданием пищи другим животным сильнее подкрепляет, чем потребление пищи?
В школе Павлова тоже было открыто латентное научение. Оно, правда, было названо сенсорным предусловным рефлексом. Например, собакам предъявляли 20-30 сочетаний последовательно действующих двух раздражителей без всякого подкрепления (например, звук и свет). После некоторого количества сочетаний этих раздражителей на один из них в последующем вырабатывался условный пищевой или оборонительный рефлекс. Оказалось, что второй раздражитель сразу же без всякого научения вызывает точно такую же пищевую или оборонительную реакцию.[186] Итак, даже у животных научение может происходить без непосредственного подкрепления. Тем более это так у человека. Но, разумеется, в глазах бихевиористов и физиологов-кондиционистов данные о латентном научении никоим образом не опровергли их теории. Эти любители строгой эмпирики вообще легко уживаются с любыми противоречиями.