Пётр Гальперин - Введение в психологию
Но существует еще один вид ориентировочного подкрепления, значение которого трудно переоценить. В отличие от подкрепления полного и неполного, но все-таки получаемого или неполучаемого, которое поэтому можно назвать альтернативным («да-нет»), этот новый вид подкрепления можно назвать «относительным ориентировочным подкреплением», так как оно возникает из учета того отношения, в котором фактический результат действия оказывается к намеченному, заданному. Так, например, животное промахивается и не достигают «цели»: сточки зрения «альтернативного подкрепления» это просто «нет», т. е.
отрицательное подкрепление; однако, если при этом животное замечает насколько и куда оно отклонилось от цели, то это служит относительным ориентировочным подкреплением и позволит ему внести надлежащую поправку в следующую «пробу».
В процессе формирования новых действий путем «проб и ошибок» успешное действие сначала возникает случайно, среди многих безуспешных проб. Постепенно число таких проб уменьшается, а потом и вовсе исчезнет. Если бы существовало только альтернативное подкрепление («да-нет») и каждая проба получала только квалификацию «правильно-неправильно», никакого прогресса в научении не могло бы наступить: неудачные пробы просто отбрасывались до появления такой же случайно удачной пробы. Допустим, что эта удачная проба сразу оставляет после себя четкую кинестетическую картину, по которой она может быть точно воспроизведена в следующий раз. Но тогда выступает другая сторона проблемы: только в исключительном случае положение животного относительно «цели» окажется точно таким же, каким оно было в прошлой, удачной пробе; между тем достаточно уже небольшого изменения этого относительного положения, чтобы точно воспроизведенное и в прошлый раз удачное действие теперь оказалось неудачным. Если к этому добавить неточное исполнение прежде удачного действия (что практически всегда имеет место), то вероятность его успешного выполнения становится еще меньше. Собственно это мы и наблюдаем, когда вслед за успешным выполнением задания следует большое число неудачных проб.
Основное положение «метода проб и ошибок» заключается в том, что удачные пробы закрепляются, а неудачные отсеиваются. Но это констатация факта, а не объяснение. В качестве объяснения оно, как мы только что видели, несостоятельно: действие, которое закрепилось как удачное, в следующий раз, по всей вероятности, станет неудачным. На том же основании оно должно быть «отсеяно» и процесс начинается «сначала». И это может повторяться многократно, «до бесконечности», раскрывая ошибку приведенного объяснения: одного закрепления удачного действия совершенно недостаточно, чтобы обеспечить его все более частое появление и окончательное утверждение. Здесь нужен еще один, и притом собственно психологический «фактор» — все более полный и тонкий учет роли небольших изменений в условиях действия, все более точное примеривание его к этим условиям и все большее приспособление действия к ним — еще до выполнения, в плане образа.
В еще большей степени эти требования относятся к неудачным пробам. Если они просто отбрасываются, то создается полная неопределенность, какой должна быть следующая проба. Но если неудачная проба не просто отбрасывается, а сопровождается учетом отклонений фактического результата от заданного, то в характеристику неудачной пробы вносится существенное дополнение: является ли она приближением к цели или удалением от нее, в какую сторону и насколько и, значит, какую поправку нужно внести, чтобы в следующей пробе достигнуть цели или хотя бы приблизиться к ней. В ряде повторений такие поправки естественно ведут ко все большему приближению к «правильному действию». В дальнейшем уже одно примеривание в плане восприятия позволяет осуществить приспособление действия к наличным обстоятельствам.
Все это полностью относится и к применению уже сформированных действий. Лишь в исключительных случаях точно воспроизводится то соотношение между индивидом и объектом, при котором в прошлый раз действие было удачным. Чтобы успешно воспользоваться этим действием в новой, актуальной ситуации, это действие нужно сначала примерить — в плане восприятия — и заранее внести необходимые поправки, чтобы приспособить к наличным (и несколько измененным) условиям.
Такие поправки предполагают информацию о фактическом результате действия и его сопоставлении с заданным. Но все это должно быть сделано заранее! Естественно, что когда «правильное действие» и его условия заранее известны и материально присутствуют (в виде ситуации, с одной стороны, и заложенной в ЭВМ программы, — с другой), то управляющее устройство может обеспечить успешное выполнение действия. Но когда правильный путь или поправка к нему еще неизвестны, то наметить их предварительно (до начала или во время исполнения) и руководить исполнением действия посредством сличения его фактического хода с намеченным можно только путем ориентировки в плане образа.
Психическое отражение поля действия и соотнесение его фактического и заданного хода в плане образа составляют обязательное условие успешного выполнения действия, у которого необходимое постоянство условий заранее не обеспечено. Тем более, что это обязательное условие всякого научения, включая и научение путем проб и ошибок.
Короче говоря, как процесс образования, так и успешное применение действий в обстановке, требующей их приспособления (по направлению, расстоянию, силе, темпу), возможны только на основе психического отражения ситуации, с помощью идеальных действий в плане этого отражения и на основе их подкрепления, не только альтернативного, но прежде всего относительного и чисто ориентировочного.
На том уровне развития животных, где автоматические реакции становятся не только недостаточными, но и опасными, новые возможности существования и развития открываются благодаря психическому отражению мира и действиям в плане этого отражения. С этого уровня филогенеза психика становится необходимым условием дальнейшего прогрессивного развития животного мира. О значении психики, сознания в общественной жизни людей, само собой разумеется, не приходится и говорить.
§ 4. Механизм активных действий
Потребность вводится в картину окружающего мира благодаря тому, что среди ее объектов субъект опознает и выделяет «вещь», которая отвечает этой потребности. Уже благодаря этому ситуация приобретает смысловую центрацию, определенный смысл [60]. Когда же далее намечается путь к этой цели и на этом пути выделяются определенные объекты и отрезки расстояния, они получают разное «функциональное значение» в зависимости от
своего отношения к цели действия и положения на пути к ней. Так, картина наличной ситуации приобретает определенное психологическое строение с разделением на то, что имеет основной смысл или только функциональное значение. Сначала эти разные значения намечаются и сохраняются лишь в самом процессе ориентировки, в процессе соотнесения цели с отрезком пути, отделяющим ее от субъекта. Поэтому они устанавливаются в направлении от цели к субъекту, т. е. в порядке, обратном ходу действия, по так называемому «градиенту цели» [61]. Этот градиент в некотором отношении представляет собой парадоксальное явление: чтобы достичь цели, нужно каждый раз пройти весь путь от начала до конца, а закрепляется этот путь по отдельным отрезкам, начиная от конца к началу! Почему начальные отрезки пути не запоминаются по меньшей мере так же, как его завершающие части? Тем более что первые требуют большего ориентировочного напряжения, чем те, что расположены ближе к цели.
Видимо, запоминание пути определяется не только частотой его прохождения и величиной прилагаемых усилий, но в первую очередь ясностью отношения его частей к цели и, следовательно, необходимостью ориентироваться на каждом микроотрезке ситуации на его отношение к ближайшей цели [62]. В начале научения, когда промежуточные цели еще не намечены, такой ближайшей целью является только основная, конечная, с которой поэтому и начинается процесс выделения пути. В целенаправленном действии основная цель есть первое и очевидно значимое среди прочих объектов поля, которые выделяются и запоминаются лишь по мере увязки с нею.
Даже у животных цепь промежуточных ориентиров и действий может быть очень длинной, но она обязательно должна заканчиваться основным подкреплением, «конечной целью», иначе промежуточные цели теряютсвое вторичное, производное от нее значение. Этим объясняется тот факт, что образование условных рефлексов второго порядка без подкрепления первого оказывается трудным и нестойким [63]. Между тем, цепи условных рефлексов, которые завершаются «настоящим подкреплением», могут быть очень длинными (Б. Ф. Скиннер, А. В. Напалков). Подкрепление должно быть значащим, а не условным, а условный раздражитель (именно условный) сам по себе является индифферентным и никаким устойчивым значением, даже ориентировочным, не обладает; образование условной связи на одном ориентировочном подкреплении требует поддерживать ориентировочные раздражители «живыми», все время в какой-то мере «новыми», т. е. безусловными, а не условными, хотя и «чисто ориентировочными раздражителями». Условные рефлексы опираются на связь между подкреплением и тем, что ему систематически предшествует, предупреждает о нем, ведет к нему. И естественно, что эта связь намечается не от начальных отрезков и ориентиров пути, а от последнего, явственно увязанного с целью и поэтому в обратном порядке — «от конца к началу».