Виктор Аллахвердов - Методологическое путешествие по океану бессознательного к таинственному острову сознания
Однако в приведенных примерах речь не идет о научении. У ребенка происходит созревание мышечной массы, но этот процесс протекает независимо от задач научения. Так, узкие ботинки постепенно разнашиваются, но нельзя же всерьез считать, что они научаются. Приобретение знаний в процессе научения тоже происходит. Но и это – сопутствующий научению фактор. В компьютер можно ввести программу распознавания речи, учитывающую накопленный до этого опыт распознавания. Но вряд ли стоит говорить, что теперь компьютер научается распознавать речь. Поясню загадочность реального процесса научения на примере. В одном исследовании взрослому человеку предъявлялось 10 лампочек так, что в ответ на зажигание некоторых из них он должен был как можно быстрее нажимать на соответствующие клавиши. Оказалось, что научение не закончилось и после 75 тысяч проб – время реакции испытуемого продолжало уменьшаться. Чему именно в этом эксперименте научался испытуемый? Быстро нажимать на кнопку в ответ на сигнал?
Научение характеризуется тем, что человек путем многократного повторения одних и тех же действий постепенно все лучше и лучше делает то, чему он учится. Но позвольте: как в результате повторения одних и тех же действий можно повысить эффективность деятельности? Ведь если действия одни и те же, то эффективность просто не может повышаться. Как бы часто ни повторялись те же самые неумелые действия, они останутся теми же неумелыми действиями. А если действия не одни и те же, то зачем нужно повторение? Пожалуй, только Н.А. Бернштейн честно признавал наличие этой проблемы. Есть у этого парадокса и важные дополнительные обертоны: как человек, переходя в процессе научения от одних неумелых действий к другим, узнаёт, что эти другие неумелые действия лучше, чем первые?
Первые теории научения возникли в лоне физиологии высшей нервной деятельности (за любовь к термину «условный» назовем эти теории вслед за Бернштейном кондиционистскими) и их ближайшего психологического сородича – бихевиоризма. Методическое остроумие экспериментаторов впечатляет. Оно позволило получить фейерверк неожиданных результатов. Я восхищаюсь красивыми экспериментами, проведенными в этих школах, осознаю ценность разработанных ими методов исследования и даже признаю важность изучения физиологического аппарата, обеспечивающего когнитивные процессы. Но при всём при этом с большим недоверием отношусь к их объяснительным конструкциям. Ибо когда знакомишься с созданными ими теориями внимательнее, не покидает мысль, что ключевое слово «научение» внесено в заглавие этих теорий по тому же принципу, каким воспользовался замечательный писатель О. Генри, назвавший свой роман «Короли и капуста». В этом романе, как известно, рассказывалось о чём угодно, кроме вынесенных в заглавие и напрочь отсутствующих в тексте королей и капусты.
Классические бихевиористы вслед за школой И.П. Павлова стали строить теории научения, в которых подчёркивалась роль подкрепления в процессе научения. Мол, именно наличие подкрепления приводит к образованию связи между разными раздражителями. Идея рождена экспериментами по выработке условных рефлексов. Так, звонок, предупреждающий о подаче пищи, начинает связываться с самим процессом еды и сам по себе вызывает слюноотделение. Или же: если какие-то движения животного приводят к успеху, тогда оно стремится их повторять и образуется временная (в терминах павловской школы), сочетательная (термин В.М. Бехтерева) или ассоциативная (бихевиоризм) связь «движение — успех». Вообще здесь используется море синонимов. Павлов в последние годы предлагал не различать временную связь как физиологическое явление от ассоциации у психологов и говорил об их «полном слитии, полном поглощении одного другим, отождествлении».[173] Э. Торндайк вводил представление о связях, находящихся в отношении сопринадлежности (appurtenance). Предполагается, что эта связь образуется где-то в головном мозге. Приводится огромное количество подтверждающих эмпирических аргументов: в опытах на животных показано заметное влияние величины, частоты и времени подкрепления на скорость выработки условных рефлексов; выработанный навык угасает, если он перестаёт подкрепляться, и т.д.
Честно признаюсь, в этой схеме не понимаю ничего, хотя она и сегодня, наверное, рассказывается студентам во всех странах мира. Во-первых, не ясно, что с чем связывается. Во-вторых, загадочно, как связь образуется и почему она должна «упрочиваться». И, в-третьих, не понятно, как это всё приводит к повышению эффективности деятельности. Попробуем в этом разобраться поподробнее, учитывая популярность этих концепций в научном сообществе (к счастью, падающую).
Итак, что же с чем связывается? Связь предполагает участие в ней, по меньшей мере, двух сторон. Обычно в качестве этих сторон называются либо «движение – подкрепление» при выработке инструментальных рефлексов, либо «стимул (условный сигнал) – подкрепление (безусловная реакция)» при выработке условных рефлексов. Вначале обсудим ту сторону этой связанной пары, которая именуется подкреплением. Что же именно выступает в качестве этой «связанной стороны»?
Прежде всего, подкрепление – процесс, имеющий своё начало и конец. Что является подкреплением в задаче избегания: болевое раздражение целиком, ожидание болевого воздействия, начало болевого раздражения или, как полагал, например, К. Халл, акт прекращения болевого раздражения? Собаке в качестве подкрепления дали мясо. Что же включается в связь? Сам факт появления мяса в кормушке? Попадание мяса в ротовую полость? Процесс поедания мяса? Момент попадания мяса в желудок? Выделение желудочного сока? Чувство насыщения? Чтобы почувствовать весь ужас этой проблемы, рассмотрим механизм замыкания подражательного условного рефлекса. Л.А. Орбели представлял его следующим образом. У животного-«зрителя» во время наблюдения за условнорефлекторными действиями другого животного в результате раздражения видом и запахом пищи, которую дают другим животным, возникал очаг возбуждения. Далее этот очаг связывался с другим очагом, вызванным условным раздражителем.[174] Если принять эту интерпретацию, то вид и запах пищи уже являются подкреплением.
Но этого мало. Л.В. Крушинский обнаруживает у животных экстраполяционный рефлекс. Оказывается, что животное способно предугадать невидимое им движение кормушки за ширмой: оно безошибочно бежит навстречу двигающейся кормушке.[175] Итак, по-видимому, в подкрепление должно входить представление о месте нахождения подкрепления? В исследовании П.К. Анохина выяснилось: если при выработке условного рефлекса заменить обычно даваемый собаке мясосухарный порошок (смесь молотых сухарей, мясо-костной муки и воды в соотношении 1 : 2 : 1,5.) на подкрепление «большей силы» – на мясо, то голодная собака отворачивается и не ест. Она ведёт себя вопреки тому, что Павлов называл «общим физиологическим законом» (т.е. обязательности движения организма к благоприятствующим его существованию факторам), потому что ожидает в качестве подкрепления порошок!
Наконец, обнаруживается, что обезьян не удается научить понимать человеческую речь, если использовать только пищевое подкрепление, но они вырабатывают подобный навык при совершенно других формах поощрения. Пишет У. Фёрнесс: "Обе мои человекообразные обезьяны способны были понять то, что я говорю, более разумным образом, чем любое специально обученное животное, которое я только видел. В воспитании этих обезьян пищевая приманка никогда не использовалась, а единственным вознаграждением были похвала и ласка".[176] Так что же именно является тем «подкреплением», которое вступает в связь? Всё названное, а заодно и всё остальное? Но всё это вместе даже перечислить невозможно, как же оно может вступать в связь? Это отнюдь не пустой вопрос. Ибо если хотя бы одна сторона, вступающая в связь, не определена, то о какой связи вообще идёт речь? Единственный выход из положения – определить, что подкреплением является то, что животное принимает за подкрепление. Сами исследователи при этом, разумеется, не знают, что животное решает принять за подкрепление. Как, например, из умозрительных соображений решить, что произойдёт, если собаку регулярно кормить не мясосухарным порошком, а бараниной, а потом нежданно «подкрепить» говядиной или уткой – она и в этом случае отвернётся?
Но это еще полбеды. За схемой вообще не заметили логической подмены. Успех не может привести к научению – ведь для достижения успеха животное уже должно быть наученным, лишь потом оно может образовывать связи с подкреплением. Подкрепление же в принципе не может ничему научить и даже не может хоть как-то помочь научению. Как ни корми крыс или голубей, они не научатся играть в преферанс. И если, например, животное не способно отличить синий цвет от зелёного или вертикально заштрихованную дверцу от горизонтально заштрихованной, то никаким вознаграждением такую способность не развить. Вот как осторожно о роли подкрепления пишет А. Бандура, дрейфующий от чистого бихевиоризма к когнитивистски окрашенным конструкциям: «Подкрепление представляет собой эффективное средство регуляции уже заученного поведения, но в то же время оно является относительно малоэффективным способом его формирования».[177] Я бы высказался резче: подкрепление вообще не может быть ни способом, ни причиной научения, а играет лишь роль информирующего и мотивирующего начала.