В. Гриценко - Перевоспитание собак
Американский ученый Б. Скиннер, один из основоположников оперантного научения, показал, что результат, для того чтобы стать подкреплением какому—либо действию, должен следовать за ним в тчение 10 с. Подчеркну, что это правило работает в естественной среде, когда животное может совершать в секунду массу самых разнообразных нужных и ненужных действий. И. П. Павлову в его знаменитой «башне молчания» удавалось вырабатывать условные рефлексы при отставлении подкрепления до 30 мин и более от условного раздражителя. Такие рефлексы были названы отставленными условными, но оказалось, что они вырабатываются с трудом или вообще не вырабатываются. С точки зрения отечественной физиологии высшей нервной деятельности наказание можно определить как далеко отставленное отрицательное подкрепление.
Наказание не учит, не сообщает животному информацию о том, какое поведение правильное. Собака, которую вы наказываете за съеденные тапочки, ничего не может понять, потому что в течение последнего часа она не ела никакой обуви (и вам бы порадоваться этому). И еще: наказание чаще всего учит тому, как не попадаться, а не тому, как правильно себя вести. Очень трудно для человека, а для животного практически невозможно, изменить будущее поведение, чтобы потом избежать его последствий. Поэтому лучше присмотритесь к себе – чаще всего, наказывая собаку, вы просто даете выход своим эмоциям и своим обидам на нее.
Наказание опасно тем, что, как замечает К. Прайор, оно служит мощным подкреплением наказывающему. Если при помощи наказания нам удалось исправить (а это случается) поведение, то бессознательно мы все чаще и чаще начинаем прибегать к нему. А избыток отрицательных воздействий на молодое животное приводит к тому, что у него пропадает всякое желание воспитываться и дрессироваться, оно вырастает зашуганным и робким.
Наказание может помочь, когда оно не очень далеко отставлено от нежелательного действия и очень сильное или неожиданное и непривычное и если поведение, с которым вы боретесь, не очень закрепилось у собаки.
Метод 4. Отрицательное подкрепление
Вопрос о подкреплении, как ни странно, довольно запутанный. В отечественной школе физиологов подкреплением считают все безусловные (непосредственные) воздействия на животное, которые следуют после условного сигнала (например команды). Безусловные воздействия – это и предложение собаке пищи, воды, и наш окрик, это и оглаживание, и шлепок, в общем, все, что собака непосредственно может воспринять. В случае наличия подкрепления условный рефлекс называют положительным (подкрепляемым), а отрицательным, или тормозным (не—подкрепляемым), – в случае отсутствия безусловного воздействия. При таком подходе болевые воздействия на собаку можно считать подкреплением, положительным для того действия, которое мы вырабатываем, например, движение собаки рядом с собой. Действие, которое вырабатывается при помощи боли, вызывает у собаки оборонительный положительный рефлекс. Собака совершает нужные нам действия, уходя от боли, предотвращая ее, т. е. обороняется.
В оперантной дрессировке подкреплением считается любое воздействие, увеличивающее или уменьшающее вероятность повторения в будущем поведения, предшествующего воздействию. В таком случае положительным подкреплением считается воздействие, которое увеличивает вероятность предшествующего ему действия в будущем. Другими словами, животное всегда стремится к получению положительного подкрепления, поскольку этот момент всегда положительно эмоционален. И, наоборот, животное стремится избежать отрицательного подкрепления, т. к. оно вызывает отрицательные (негативные) эмоции и снижает вероятность повторения в будущем поведения, приводящего к такому состоянию. Неудовлетворение потребности считается в оперантной дрессировке мощным отрицательным подкреплением.
По мнению К. Прайор, отрицательное подкрепление – это любое неприятное событие или ощущение, действие которого можно прекратить или избежать, изменив поведение. Отрицательное подкрепление, как и положительное, – одна из составляющих самого поведения, поэтому на него можно повлиять только изменением поведения, и в этом его отличие от наказания.
Для того чтобы наверняка понять отличие отрицательного подкрепления от наказания, вернемся к примеру, упомянутому ранее. Ваша собака часто залезает на диван. Вам это не нравится и вы отучаете ее следующим образом: как только застаете на диване, тут же ее ругаете и задаете трепку. Как правило, агрессивное поведение хозяина прекращается сразу же, как только собака спрыгивает с дивана. Если следовать вашей логике, то благодаря примененным мерам воздействия собака должна сообразить, что лазать на диван ей нельзя. Ничего подобного! Собака считает, что грубый резкий окрик хозяина означает: скорей слезай, чтобы избежать трепки.
Однако многие собаки довольно быстро понимают, что появление хозяина, когда они лежат на диване, приводит к резкому окрику, и если с дивана не слезть, то схлопочешь. В результате ретируются сразу, как только увидят хозяина на пороге комнаты. Третьи идут еще дальше, они связывают наличие хозяина в квартире с его агрессивным поведением во время «диванного положения» и в его присутствии ведут себя как паиньки. Когда же хозяина нет, все собаки ведут себя одинаково – «диванолюби—во». Почему? Да потому что неприятное для собаки воздействие (ругань, шлепки) выступает подкреплением (отрицательным или положительным, – это еще вопрос) ее действия (спрыгивания с дивана) и наказанием по отношению к залезанию на диван. Таким педагогическим воздействием вы обучаете собаку быстро спрыгивать с него по команде (в данном случае это комплексный раздражитель – ваш вид и осуждающий крик).
Как же отучить собаку залезать на диван? Нужно придумать нечто такое, что делало бы неприятным именно это действие. Например, можно поставить на диван заряженные мышеловки. Одного добермана, который со всего размаха шлепался на диван, отучили так: разложили на диване остриями вверх шиферные кнопки и прикрыли их покрывалом. Для отучения оказалось достаточным одного прыжка. Более того, бедняга начинал активно сопротивляться при попытке затащить его на диван.
Отрицательное подкрепление – очень эффективный способ формирования поведения, но не лучший. Проследите за собой, в общении и с людьми, и со своими собаками мы в основном пользуемся именно им. Нам почему—то кажется, что хорошее поведение – это норма. Так и должно быть, и что уж тут радоваться и хвалить? Поэтому и не замечаем, а что самое плохое, и не подкрепляем положительно нужное нам поведение. Мы его как будто не видим, а обращаем внимание только на огрехи, за что и ругаем собаку. Но слишком частое применение отрицательного подкрепления приводит, особенно у щенков, к появлению робости, неуверенности в себе, тревожности и отбивает охоту от самого процесса дрессировки. Потому что собака начинает понимать: ее новый навык увеличивает возможность дополнительного получения отрицательного подкрепления, которого она, естественно, стремится избежать. Кстати, классическая дрессировка и называется классической, потому что строится в основном на отрицательном подкреплении. Например, команда «Сидеть!» свидетельствует о возможных неприятных, а то и болевых воздействиях на область крестца, и чтобы их избежать, необходимо сесть.