Отрицательное подкрепление и положительное наказание. Метод случайного подкрепления поведения. Использование положительного наказания

Нередко дрессировщики путают понятия отрицательного подкрепления и положительного наказания . Хотя они близки между собой, это не одно и то же. При положительном наказании имеет место некоторое неприятное событие. Например, коррекция поводком, когда собака отказывается подходить по команде. Собаку наказывают за то, что она не подходит, так что в будущем она будет понимать, что если она не подойдет, то получит воздействие. Как только собака усвоит это, она будет подходить к вам, избегая коррекции. Отсутствие коррекции это пример отрицательного подкрепления.

Ключевое отличие между этими двумя понятиями состоит в том, что отрицательное подкрепление будет закреплять поведение, в то время, как положительное наказание будет приостанавливать поведение. Мы будем использовать термин коррекция по отношению к положительному наказанию.

Собака может реагировать на положительное наказание одним из четырех способов, в зависимости от силы наказания и темперамента собаки:

1. Подчиниться и избежать коррекции, выполнив команду

2. Убежать

3. Вступить в борьбу

4. Замереть

Положительное наказание – это метод, который обычно используют, чтобы прекратить нежелательное поведение. При правильном применении оно действует, но вы должны знать, какой вид воздействия будет эффективным, но не чрезмерным.

Очевидные недостатки использования положительного наказания это его явные нежелательные побочные эффекты: бегство, агрессия, апатия и достаточно часто общее подавление поведения, за которое наказывают. Другими словами, если собаку наказывают за сидение в одной ситуации, она может не садиться в другой.

При дрессировке собак используют различные виды коррекции (положительного наказания). Как и в случае с мотивацией, необходимый уровень коррекции варьирует от собаки к собаке. Существует, однако, огромная разница между коррекцией и жестоким обращением, и дрессировщик должен осознавать эту разницу.

Кроме очевидных моральных и этических проблем, возникающих из-за жестокого обращения, все дрессировщики должны понимать, что жестокое обращение способствует лишь подавлению характера животного. Подавленная собака не может воодушевленно работать на дрессировочной площадке или на соревнованиях. Начинающему энтузиасту может показаться, что собака удовлетворительно выполняет упражнение. Однако опытный глаз увидит, что собака запуганна проводником и чрезмерно осторожна, ей будет не хватать таких признаков победителя, как огонь в глазах и упругость шага.

Поскольку разграничение между коррекцией и жестоким обращением столь важно, будет уместным определить некоторые понятия. Эти определения взяты из словаря.

· Коррекция: корректирующее действие, исправление, устранение ошибки, регулирование, замечание или тренировка.

· Принуждение: принуждающее действие. Очень сильно или убедительно управлять или подгонять. Вызывать определенные действия, оказывая чрезвычайное давление.

· Насилие: Способность воздействовать интенсивностью, физической силой, чтобы принудить, склонить или убедить. Заставлять физически, психологически, или морально.

· Жестокое обращение: Злоупотреблять, поступать неправильно, причинять зло, насиловать и оскорблять.

· Истязание: Намеренное действие причинения сильной боли.

Другой важный момент, о котором необходимо помнить: Коррекцию следует использовать только если доказано, что собака знает, чего вы от нее хотите. Корректировать что-то, чего собака не понимает, в первую очередь означает скатиться до уровня жестокого обращения.

Использование положительного наказания.

Чтобы коррекция была эффективной, она должна:

1. Быть немедленной

2. Быть остаточно сильной, чтобы подавить нежелательное поведение

3. Быть связанной только с нежелательным поведением

4. Происходить всякий раз, когда совершается нежелательное поведение

Если вы осознаете, что изводите собаку, многократно в течение короткого периода заставляя ее сделать что-либо, это означает, что вам надо изменить подход к дрессировке. Продолжение того же способа дрессировки не приведет вас никуда. Вместо этого следует разбить обучение на маленькие, позитивные составляющие, и объединять их в одно целое позже. Лучше всего начать все с начала.

Отрицательное наказание: лишение подкрепления

Когда собака интересуется подкреплением, и сделает что угодно, чтобы его получить, его отсутствие может быть эффективным воздействием в дрессировке. Удаление ожидаемого подкрепления - это форма наказания, которая создает у животного неудовлетворенность. Собака работает не на основе реакции избегания, и, следовательно, не испытывает потребности убежать, замереть, или бороться. Однако она будет пытаться найти правильный путь, чтобы добыть это подкрепление. Если собака приучена в качестве подкрепления за выполнение команды или серии команд играть с любимой игрушкой, она уже обучена правилам, следуя которым она достигает подкрепления. Если собака не следует этим правилам, она обнаруживает, что это не приводит к подкреплению. Лишение подкрепления концентрирует ее на выявлении правил.

Подобный метод предоставляет собаке выбор - возможность не подчиняться командам, и возможность скорректироваться самостоятельно. Считается, что противоположностью подкрепления является не физическая коррекция, а отсутствие подкрепления.

Перерыв

Перерыв в работе во многом сходен с лишением подкрепления. Если собака излишне стимулирована или чрезмерно отвлекается на посторонние раздражители, лучше не бороться с этим, самая правильная тактика – это удалить ее с площадки на 10 минут, а затем попробовать снова. Не следует изолировать собаку на длительное время, такое, как час или два, поскольку животное не удерживает внимания долго и может начать развлекать себя само. Это делает коррекцию менее эффективной. Если собаку заставили прождать только 10 минут, или около того, то она может вернуться на площадку с совершенно другим отношением.

Надо ли добавлять, что следует прежде определить, не хочет ли собака отдохнуть. Если хочет, то перерыв не будет коррекцией.

Способ избегания

Избегание используют, чтобы исключить нежелательное поведение, связывая такое поведение с дискомфортом. Чтобы этот способ работал, коррекцию следует применять нужный момент, чтобы у собаки сформировалась ассоциация между нежелательным поведением и воздействием, и это воздействие должно быть достаточно сильным, чтобы исключить желание повторно проявлять такое поведение. Интенсивность принуждения, необходимого для собаки для осуществления коррекции, всегда должны быть минимальной.

Наиболее распространенный прием, основанный на избегании - это строгая команда «нет», в сочетании с резким коротким рывком поводка, пристегнутого к обычной удавке или строгому ошейнику. Другие примеры – вода или лимонный сок, брызгающие в морду собаке, бросок цепочки, или электроошейник.

Следует понимать, что использование строгого ошейника и электроошейника в дрессировке по Шуцхунд запрещено . Если обнаружится, что вы использовали одно из этих средств при тренировке и перед выступлением, вы можете быть дисквалифицированы . При этом известно, что они используются при дрессировке по Шуцхунд и перед соревнованиями постоянно. Мы считаем, что лучше говорить об этом открыто, чем скрывать этот факт. Таким образом, мы надеемся помочь людям понять, как работают эти средства.

Позвольте нам начать с заявления, что мы не оправдываем использование электроошейника как основного средства дрессировки. Значение имеет не только гуманистический аспект, но и следующий важный момент: электроошейник - не самый эффективный способ дрессировки для получения долговременных результатов. В то же время, мы признаем, что он используется достаточно часто, поскольку он работает. Мы против использования электроошейника при обучении новым командам. Если применять его, то только как средство коррекции, после того, как упражнение уже усвоено.

Например, если мы дрессируем собаку по защите, и она до сих пор не поняла, что по команде «дай» надо отпустить рукав, или она не чувствует себя комфортно, и под действием страха может возобновить хватку, это неподходящее время для использования электроошейника. Дело в том, что удар током это форма наказания, но прежде чем наказывать за поведение, мы должны быть уверены, что собака уже знает, как правильно реагировать на поданную команду в отсутствии отвлечения или стресса. Если она не знает этого, то наказание неэффективно и жестоко.

Рассмотрим следующий лабораторный эксперимент: собаку поместили в большой ящик, состоящий из двух отсеков. Один отсек изолированный; другой нет, и может передавать электрический ток на собаку. Собака свободно гуляет по обоим отсекам. Когда включается свет, если собака находится в неизолированном отсеке, она получает удар током. Из-за удара она начинает двигаться и в итоге обнаруживает, что в другом отсеке тока нет. После нескольких проб, если загорается свет, собака избегает удара током за счет быстрого перемещения в изолированную часть ящика. Как только свет выключают, она продолжает нормальное поведение, заходит в обе части, уверенная, что знает, как избежать удара током.

Однако, жизнь это не лаборатория. При дрессировке у собаки есть гораздо больше возможностей выбора. Поэтому мы полагаем, что электрокоррекция может быть использована, только если мы уверены, что собака знает, чего от нее хотят. Поэтому электрошок в меньшей степени сбивает с толку и лучше служит для наказания неповиновения, чем для начальной коррекции.

Мы должны также четко осознавать следующее: если под воздействием элекроошейника собака по-прежнему не желает менять свое поведение, принимая решение, что же делать дальше, проводник должен быть очень осторожен. Воздействие более высокого уровня может сработать, но при этом в то же время усиливается боль! В этом случае проявляется этический аспект протворечия между гуманностью и жестоким обращением с животным. Никто никогда не должен переступать эту черту только ради спорта.

Электроошейник прошел длинный путь в своем развитии. В разных моделях предусмотрены различные возможности, начиная от предупреждающего звонка перед коррекцией и заканчивая предложением различных уровней воздействия, на выбор проводника. Как и со всеми другими способами коррекции, выбранный подходящий уровень, будет тем ниже, чем мудрее и опытнее проводник. Поэтому таким методом должны пользоваться только наиболее опытные дрессировщики.

При использовании электроошейника, проводник должен подобрать подходящий уровень воздействия для своей собаки. Лучше всего сделать это во время выполнения такого упражнения на послушание, которое собака очень хорошо понимает. Тогда при применении коррекции не возникнет путаницы. Проводник должен знать, какое воздействие будет слишком сильным, а какое слишком слабым. И четко осознавать, что если вы случайно ударите собаку током в неподходящий момент, в дрессировке это может значительно отбросить вас назад. Это еще одна причина того, что электроошейник могут использовать только опытные дрессировщики.

Мы никогда не должны забывать, что не все собаки подходят для Шуцхунд. Кто-то может быть счастлив, занимаясь чем-то другим, и заставлять его с помощью электрошока делать то, что для него не естественно - это жестокость. Ни один дрессировщик не должен допускать жестокости. И здесь границы несколько размываются. Использование электроошейника для собаки с низким болевым порогом или слабыми нервами – жестокость. Использование того же ошейника для самоуверенной собаки с высоким болевым порогом жестокостью не является. То же можно сказать и в отношении строгого ошейника.

Если вы собираетесь использовать электроошейник (помните, мы не считаем это необходимым), используйте его аккуратно и гуманно. Лучший результат будет получен, если вы наденете ошейник за 2 часа до тренировки, и снимете его через час после. Таким образом, собака не свяжет его прочно с дрессировкой.

Важное преимущество электроошейника состоит в том, что он позволяет проводнику корректировать собаку на расстоянии и без поводка. Вероятно, лучше обратиться к этому методу, если опробованы все другие дрессировочные решения, а собака – крепкое животное с высоким болевым порогом. Но даже и в этом случае ошейник должен быть использован только как вспомогательное средство и никогда не должен быть единственным способом дрессировки.

Издержки использования электроошейника для решения проблем заключаются в том, что он позволяет проводнику лениться. Проводник может не заботиться о поиске причин того, почему собака ведет себя определенным образом, и не пытаться решить проблему, используя психологию – что принесло бы более долговременные результаты и было бы гораздо лучше для собаки.

В другом поведенческом эксперименте собаку поместили в ящик с заслонкой, где был барьер между двумя отсеками, так что собака не могла перемещаться из одного в другой. Ее подвергали беспорядочным воздействиям тока, которых она не могла избежать, что бы она не делала: скулила, лаяла, прыгала и т.д. Через некоторое время собака просто легла и смирилась с током. Это называется выученная беспомощность. Когда животное узнало, что не может избежать ударов током, барьер убрали, и у собаки появилась возможность переместиться в другую часть ящика и избежать воздействия, но она этого не сделала. Этот эксперимент был проведен на большом числе собак, и результаты всегда были одинаковые. Потом экспериментатор переместил животное в другую часть ящика, чтобы показать ему, что есть способ избежать тока. Большинство собак на это не отреагировали, и чтобы научиться им понадобилось минимум 200 попыток.

Другая отрицательная сторона использования электроошейника – то, что некоторые собаки «знают про ошейник». Это значит, что собака подчиняется стопроцентно, когда она в ошейнике, но будет такой же непослушной, как всегда, если его снять. Чаще всего это случается, если проводник начинает лениться и довольствоваться ошейником, используя его для всех видов коррекции.

Мы предпочитаем использовать отрицательное наказание (лишение подкрепления) на первом и в большинстве случаев единственном этапе – для прекращения нежелательного поведения, вместо использования электроошейников и других способов принуждения. Это позволяет собаке самостоятельно выучить, каким правилам надо следовать, чтобы получить то, чего она хочет. При этом не используются ни ошейники, ни избегание, ни физическое наказание. Собака может учиться на своих собственных ошибках. На испытаниях собака будет чувствовать себя комфортнее и работать целеустремленнее, чем после дрессировки с помощью принуждения. Дело в том, что собака научилась, как думать о своих собственных действиях, а не просто правильно реагировать .

Принуждение

Чтобы быть готовым "читать" собаку и успешно использовать принуждение, нужен некоторый опыт. Воздействие должно быть достаточно сильным, чтобы прекратить отвлечение, не более и не менее. Вы также должны быть способны немедленно после коррекции, в случае необходимости привести собаку в состояние высокого возбуждения. Жесткая коррекция не помогает.

В дрессировке, и особенно при использовании принуждения, всегда важно, чтобы у вас было что-либо действительно нужное собаке. Если у вас нет ничего для мотивации собаки, дрессировка может оказаться менее результативной, или же собака будет работать только для того, чтобы избежать воздействия.

Сделав все эти предупреждения, приведем пример метода принуждения, который может помочь в некоторых ситуациях, когда все остальное не помогло. В этом случае вы используете сильное физическое воздействие немедленно после подачи команды, но перед тем как собака может что-то сделать. Это может быть рывок за ошейник вверх, чтобы посадить, или за ошейник вниз, чтобы положить. Смысл в том, чтобы собака захотела своей реакцией опередить воздействие (пример классического Павловского условного рефлекса).

Уровень воздействия должен быть подбираться очень осторожно, индивидуально для каждой собаки. Вам нужна надежная собака, а не паника и отказ от работы. Подобные воздействия не должны быть постоянным. Принуждение не должно становиться сигналом к выполнению вашей команды!

Помните, что результат действия приемов, основанных на принуждении – исправление поведения, или его ухудшение – проявляется обычно не сразу же, на том занятии, когда они применялись, а на следующем. Дело в том, что принуждение запускает и поведение избегания. Надо надеяться, что на следующее занятие собака продемонстрирует более правильное поведение и меньше избегание, а не наоборот. Лучше всего подождать и посмотреть, как она будет действовать во время следующего занятия, вместо того, чтобы пытаться добиться безупречного выполнения сразу же.

Глава 5

Шуцхунд III

Работа по следу

Работа по следу - это бесспорно наиболее сложный этап Шуцхунд для большинства дрессировщиков. Даже если вы владелец превосходной следовой собаки, остается беспокойство об условиях, в которых придется прорабатывать след и о том, как собака отработает сегодня. Это особенно актуально для серьезных соревнований в спорте высокого уровня. Как и на Олимпийских играх, иногда все зависит от счастливого жребия.

Работа по следу отличается от упражнений по послушанию и защите тем, что собака должна выполнять упражнение без дополнительных команд. В послушании или защите вы периодически даете собаке команду, которая стимулирует ответ. На следовой существует только начальная команда на поиск. После этого вы должны просто надеяться на собаку.

Давайте начнем с того, что бегло взглянем на правила следовой работы и на то, что именно оценивают судьи. (Правила для прокладчика следа, проводника и собаки взяты из Официальной Книги Правил Объединенного Американского Клуба Шуцхунд.)

След

· Длина следа от 800 до 1,000 шагов

· След прокладывается посторонним

· Давность следа 50 минут

· На следу оставлены 3 предмета

· След четыре раза меняет направление под углом 90º

· Судья определяет направление следа, согласно условиям имеющихся в наличии полей

· Насколько возможно, следы должны быть проложены по-разному. Надо обратить внимание, чтобы предметы были разложены на каждом следу по-своему. Расположение углов на разных следах должно различаться.

· Начало следа должно быть заметно отмечено флажком, знаком или меткой, которые втыкаются в землю слева от точки старта.

Прокладчик следа

· Прокладчик следа направляется к точке старта и остается там в течение некоторого времени.

· Затем прокладчик начинает движение по указанию судьи и размещает первый предмет приблизительно через 100 шагов.

· Перед прокладкой следа прокладчик должен продемонстрировать предметы судье.

· Прокладчик должен использовать предметы, которые практичны (удобны), несут запах прокладчика, размером не больше бумажника и не отличаются по цвету от грунта. Могут быть использованы очечники, бумажники и т.д.

· Предметы кладутся на след, а не рядом с ним.

· Второй предмет должен быть положен в середине второго или третьего отрезка. Это делается без остановки, и не сбавляя шага.

· Третий предмет размещается на конце следа.

Рис. 7.

1. Стандартный след Шуцхунд III

2. 250-300 шагов

3. старт

4. предмет

5. предмет

6. предмет

Проводник

· Проводник может пускать собаку на проработку следа на 10 метровом поводке или без поводка. Оба способа оцениваются одинаково.

· Во время прокладки следа собака и проводник должны быть вне поля зрения.

· Проводник готовит собаку к выполнению упражнения и, когда его вызывают, сдает рапорт судьям.

· Проводник сообщает судьям, поднимает его собака предметы, или обозначает их. Одновременное использование обоих способов правилами не допускается.

· До и во время работы на следу проводник не должен воздействовать на собаку силой или корректировать ее каким-либо способом.

· На старте проводник должен дать собаке достаточно времени, чтобы взять след. Проводник не должен позволять собаке порывистость.

· Проводник должен следовать за собакой на расстоянии 10 м. с поводком или без него.

· Поводок можно держать провисшим.

· Когда собака обозначает обнаружение предмета, проводник должен бросить поводок и немедленно подойти к собаке. Затем проводник должен взять обозначенный предмет, и показать его судье, подняв высоко в воздух. Допускается, чтобы собака подняла предмет, в этом случае проводник подходит к ней и немедленно забирает предмет.

· После завершения проработки следа проводник передает предметы судье.

Собака

· По указанию судьи собака спокойно и медленно подводится к месту старта и ставится на начало следа.

· Собака должна спокойно взять запах нижним чутьем.

· Собака должна двигаться вперед на расстоянии 10 метров (всей длины поводка) от проводника. Независимо от того, выполняется ли упражнение на поводке или без него, проводник не должен начинать движение, пока собака не отойдет на расстояние 10 метров.

· Сразу после того, как собака нашла предмет, она должна поднять его или четко обозначить: остановиться и встать, сесть, лечь, или вернувшись к проводнику. Продвижение вперед с предметом, или поднятие его во время укладки ошибочно.

Рис. 8

A’Shane Ot Vitosha Келли Мартин, SchHIII, IPOIII, лучший результат на этапе следовой работы - 100 баллов - на национальных соревнованиях DVG в 1997 году (фото Нанетт Никерсон)

Подсчет баллов

Максимальный балл на этапе следовой работы - 100. За ошибки начисляются следующие штрафные баллы.

Когда мы говорим об управлении поведением другого человека, часто возникает вопрос о подкреплении и наказании. В этой статье мы кратко рассмотрим, почему у некоторых не получается использовать эти методы.

Для того, чтобы данная статья была более актуальной, в качестве примера я буду использовать воспитание детей, но принципы, которые я здесь опишу, универсальны.
Всё, что я опишу ниже довольно банально, но иногда мы упускаем из вида совершенно очевидные вещи.

Подкрепление

Все мы слышали о том, что, если мы хотим добиться от человека нужного нам поведения, то необходимо это поведение подкреплять. Однако, довольно часто, случается такое, что наши “подкрепления” не оказывают на поведение абсолютно никакого влияния.

Например, родители хотят, чтобы их дети хорошо учились. Чтобы они это делали, некоторые пытаются такое поведение поощрять. Одни пытаются это делать деньгами, другие похвалой, третьи пытаются повесить перед ребенком манок в виде светлого будущего, которое ждет ребенка, если он будет хорошо учиться. Однако, вопреки ожиданиям, некоторые дети показывают слабое стремление учиться.

Почему так происходит? Дело в том, что многие люди не понимают, что такое поощрение. Они думают, что это просто что-то ценное или хорошее, что можно дать человеку. На самом же деле, подкреплением может быть только то, что нужно человеку.

При этом — это не просто то, в чем человек нуждается, а то, что он страстно хочет. Поэтому одна и та же вещь может являться поощрением для одного, а для другого это может быть чем-то незначительным и даже неприятным.

Возьмем к примеру какую-нибудь еду, например овсяную кашу. Очевидно, что для голодающего человека, тарелка овсяной каши будет отличным подкреплением. Ведь это именно то, что человек страстно желает. Напротив, для сытого человека, каша не будет являться поощрением и даже наоборот.

То же самое и с детьми. Для ребенка из бедной семьи, определенные материальные блага могут быть сильнейшим стимулом хорошо учиться, для ребенка же, у которого и так все есть, такие стимулы не будут работать. Все усложняется тем, что то положение, в котором находится человек, совсем не обязательно создает те потребности, которых мы ожидаем.

Если ребенок не реагирует на похвалу, то возможно ему не так важна похвала от вас. Если не помогает материальное поощрение, значит человек ориентируется на другие ценности. Какие, вы можете выяснить только сами. Проблема в том, что люди слишком разные и их воодушевляют разные вещи.

Как же быть? Как находить у человека то, что он страстно желает?

Тут существует два подхода: статистический и индивидуальный.

Что означает статистический подход?

Это означает, что некое поощрение (или наказание) срабатывает у известного нам процента людей. Нам лишь остается применить эти поощрения. Такой подход хорошо работает при поощрении большого количества народа, но у него есть недостаток, что он срабатывает не всегда.

Информация подобного рода собирается с помощью специальных тестов, опросников и так далее. Такие закономерности изучает специальная наука — психология менеджмента.

Индивидуальный подход

Индивидуальный подход направлен на поощрение строго определенного человека и тут нужно иметь с человеком очень хороший контакт. Для этого нужно внимательно за человеком понаблюдать: посмотреть, что он любит делать, чем занимает свое свободное время, к чему стремится, о каких вещах говорит. Именно в этих областях можно найти то, чем человека можно поощрить.

При этом важно понимать, что подкрепление — это не синоним мотивации, а ее замена. Например, если ребенок любит математику и она ему интересна — то это мотивация. А если ребенка награждают смартфоном за успехи в математике, то смартфон является подкреплением. Кроме того, подкрепление — это нечто в настоящем, чем награждают за прошлые заслуги, а мотивация — это нечто в будущем, идеал, к которому человек готов стремиться.

Правильное использование подкрепления

Еще раз, подкрепление — это то, что нужно человеку, а не просто какая-то хорошая вещь . При этом, нужно отметить, что подкрепление не может заменить мотивацию. Это что-то вроде приглашения попробовать действовать определенным образом.

Наша задача, чтобы с помощью подкреплений сформировать мотивацию. Основной принцип — подкреплять не только результат, но и процесс. Почему? Да потому, что если человека поощрять только за результат, то вы никогда не заставите человека любить само дело.

Одно дело хвалить ребенка за отличную оценку (результат), другое дело, когда вы хвалите его старательность и любовь к предмету. Во втором случае, вы подкрепляете процесс. В данном случае очень важно, чтобы ваша похвала не звучала фальшиво, тогда это может быть воспринято, как манипуляция и привести к обратному результату. Не стоить забывать подкреплять и результат деятельности, иначе можно столкнуться с ее имитацией.

Наказание

Как и в случае с подкреплением, к наказанию нужен индивидуальный подход. Дело в том, что наказывать человека можно только тем, чего он действительно боится. Для этого опять же нужно быть наблюдательным.

Вообще, еще Скиннер выяснил, что наказание не слишком эффективно. Дело в том, что эффект от него неустойчив. Как только человек (или животное), понимает, что наказания не будет, он сразу возвращается к нежелательному поведению.

Это означает, что если делать ставку только на “кнут”, то придется всегда все контролировать, что может быть не слишком удобно.

Но в некоторых случаях, наказание необходимо, чтобы быстро и точечно пресечь нежелательное поведение, а не тратить время на выстраивание мотивации и системы поощрения.

Главный принцип наказания — это его своевременность и четкое обозначение за что именно оно применяется.

Угроза и предупреждение

Наказание довольно часто идет рука об руку с угрозой или предупреждением (что по сути одно и тоже). Предупреждать довольно удобно, ведь не приходится каждый раз применять крайние меры. Это сокращает издержки, которые обязательно следуют за применением наказания.

А такие издержки есть всегда. Например, если начальник лишил премии подчиненного, то совершенно закономерно, что у подчиненного может возникнуть обида, что может снизить его мотивацию еще больше и сказаться негативным образом на работе.

Гораздо лучше применить угрозу или предупреждение. Благодаря этому мы получаем практически те же положительные эффекты, но снижаем эффект обиды. Однако, стоит учесть один важный момент — угроза должна быть подкреплена делами. Если угроза или предупреждение озвучены, то в случае невыполнения наших условий, она должна быть немедленно приведена в исполнение. Иначе этот метод полностью теряет свою силу.

Такую ошибку довольно часто допускают родители. Часто они предупреждают, предупреждают и предупреждают, при этом не реализуя свои угрозы. Дети мгновенно распознают это и начинают воспринимать угрозы именно за то, чем они и являются — ветром. Чтобы слова имели силу, за ними должно что-то стоять.

На эту тему даже есть крылатое выражение — “ Последнее китайское предупреждение ”, означающее бесплодные предупреждения. Угрозы, когда за ними ничего не стоит — вызывают лишь смех.

Когда мы говорим о дрессировке собак, чаще всего вспоминают о методе «кнута и пряника», то есть о наказании и подкреплении. При этом почему-то многие считают, что наказание гораздо эффективнее подкрепления. Но в действительности дело обстоит наоборот. И вот почему.

Фото: google.by

Почему подкрепление эффективнее наказания в дрессировке собак?

Собака познает мир и учится новому опытным путем, пробуя и совершая ошибки, извлекая из них уроки, изучая, какое именно поведение даст нужный результат – удовлетворение потребности. И может столкнуться с двумя результатами своих действий: подкреплением или наказанием.

Наказание – это когда собака получает в результате своих действий то, чего НЕ хочет.

Подкрепление – это частичное либо полное удовлетворение потребности, то есть то, что собака хочет получить в данный момент. А значит, действия, которые привели к такому результату, эффективны, и вероятность, что они будут повторяться, резко возрастает.

Собаки хотят получить желаемое самым быстрым и легким путем. И, приобретая опыт, вырабатывают и внедряют в жизнь самые эффективные решения.

Например, собаке нужно ваше внимание. И она методом проб и ошибок уже установила, что, если будет просто заглядывать вам в глаза, шанс получить внимание минимален, а вот если полаять, он сильно возрастает. А уж если начать жевать дорогую вашему сердцу вещь… Тогда не только сразу же будет внимание, но еще и увлекательная игра «догони и отними!» Угадайте с трех раз, что будет делать собака, когда ей в следующий раз очень захочется вашего внимания?

К сожалению, в нашем обществе людям с детства вбивают в голову, что ошибка – это что-то недостойное. Ошибки вымарывают красной ручкой в тетрадях, нещадно критикуют и ставят плохие оценки. Но ошибка – это часть опыта, без которой не обойтись!

И владельцам важно помнить, что ошибка – это ключ к поиску эффективных решений в дрессировке собак. Так что если у вас или у собаки что-то «не клеится» - это не повод опускать руки и наказывать собаку, а повод включить творческое мышление и придумать способ преодолеть трудность.

Вспомните свою обязательную учебу в школе. Мало того, что у вас нет выбора, ходить ли туда, но если к тому же учитель ходил по классу, выискивая ошибки, за которые орал, ставил двойки, грозил вызвать родителей или бил линейкой по рукам – вы любили такие занятия? Хотелось ли вам думать и предлагать новые решения? Любили ли вы этот предмет? И наоборот – если уроки были веселыми и интересными, а инициатива поощрялась – разве они не были более эффективными, не побуждали думать и предлагать новое? А почему вы думаете, что у собак все по-другому?

Самое эффективное обучение собак происходит в играх. Так что дрессировка должна стать скорее игрой по правилам, а не муштрой с жесткими запретами на любое поведение, которое выходит за рамки вашего приказа.

Фото: google. by

Да, наказание может быть эффективным для того, чтобы отучить собаку от каких-то действий (но никогда не научит ничему новому!) Однако при этом нужно учитывать, что наказание имеет массу побочных эффектов.

Побочные эффекты наказания в дрессировке собаки

Наказание не удовлетворяет потребность! И даже если оно прекратит какие-то действия собаки, она просто будет искать другой способ (или другое время), чтобы удовлетворить таки свою потребность. Например, если наказать собаку, когда она ворует еду со стола, ей будет страшно, но чувство голода от этого никуда не денется. И она просто дождется момента, когда вас не будет поблизости.
То есть наказание пугает, но не учит вести себя приемлемо.
Наказание разрушает контакт между владельцем и собакой.
Собака испытывает хронический стресс , в результате чего усугубляются поведенческие проблемы и/или возникают проблемы со здоровьем.

И если дело обстоит так, стоит ли пользоваться сомнительными методами?

Разумеется, никто не спорит с тем, что нужно устанавливать разумные границы, а дисциплина важна. Но в большинстве случаев гораздо эффективнее предотвратить «плохое» поведение – это поможет как избежать наказания, так и не дать собаке приобрести вредный опыт. Например, если речь об агрессии, стоит, пока проблема не решена, использовать намордник. Если собака убегает – водите ее на поводке, пока она не станет достаточно надежной. Да, это требует времени и усилий, но, как правило, результат того стоит.

Подкрепление, в отличие от наказания, удовлетворяет потребность собаки , а значит, дает ей нужный и полезный опыт и приводит к тому, что желательное поведение проявляется все чаще.

Преимущества подкрепления в дрессировке собаки

Подкрепление в дрессировке собак эффективнее наказания, так как позволяет удовлетворить потребность .
Подкрепление дает собаке полезный опыт и закрепляет желательное поведение.
Навык усваивается прочнее .
Укрепляется контакт с владельцем.

Так стоит ли пренебрегать столь очевидными преимуществами?

Это уж не говоря о том, что силовые методы работают далеко не со всеми собаками: некоторые в ответ замыкаются или проявляют агрессию. И цена ошибки здесь гораздо выше! Зачем же рисковать и подвергать и собаку, и себя ненужному стрессу?

Вопрос в том, что предпочитаете лично вы.

Команда "Сидеть!" Всегда, прежде чем поздороваться с собакой, нужно сначала дать ей команду "Сидеть!". Этот метод выработки противоположного условного рефлекса наиболее эффективен, если собака видит в руках приближающегося человека лакомство или игрушку, которые она получает сразу, как только примет положение сидя. При выработке этого условного рефлекса можно использовать недоуздок.

Положительное наказание. Многие распространенные, но зачастую неэффективные, стратегии борьбы с напрыгиванием на людей и покусыванием предусматривают использование положительного наказания, в частности окрика и отталкивания собаки рукой или коленом в грудь. Подвижная собака, игриво прыгающая на людей, скорее всего, примет толчок коленом за игровую реакцию. Возможно, главной причиной неудачи этих стратегий является то, что применение их представляет для клиентов слишком большие трудности. Необходимо очень точно выбрать момент: наказание должно последовать сразу, как только собака начинает проявлять данное поведение, или в пределах доли секунды после этого. Затем необходимо очень точно соразмерить интенсивность наказания. Слишком резкое наказание испугает собаку (особенно - робкую), а слишком мягкое будет неэффективным.

Проведение манипуляций по уходу за собакой. Некоторые собаки кусаются, когда к ним пытаются прикоснуться, выполняя какую-либо физическую манипуляцию, например во время расчесывания шерсти или пристегивания на поводок. Нужно тщательно расспросить клиента об особенностях поведения собаки во время покусывания. Если она при этом глухо рычит, клацает зубами или рычит, оскалив зубы, необходимо еще раз просмотреть анамнез и пересмотреть диагноз: подобные ответные реакции характерны для агрессивного поведения, и с ними нужно работать соответствующим образом.

Если свидетельств агрессии не имеется, тогда покусывание во время рутинных процедур следует устранять с помощью метода десенситизации и выработки противоположных условных рефлексов. Одним из способов применения этого метода является обучение собаки по команде сидеть, оставаться на месте и расслабиться. Когда собака научится спокойно оставаться на месте, приступают к выполнению десенситизации, как это показано на примере приучения собаки к спокойному реагированию на чистку щеткой.

Собаке дают команду "Сидеть, место!". Тренер проводит один-два раза щеткой по шерсти и затем дает лакомство за то, что она оставалась спокойной. Если собака сопротивляется, тренер убирает лакомство, делает очень короткий перерыв и затем возобновляет попытки, стараясь меньше раздражать животное прикосновением, например проводя по нему гладкой стороной щетки. Максимальных успехов можно добиться, если применение этого метода начать с коротких сеансов и заканчивать каждый сеанс на положительной ноте, не доводя дело до сопротивления собаки или укуса.

Эффективность лечения. Такие формы поведения, как прыжки на людей и покусывание, очень хорошо поддаются коррекции; у большинства собак заметное улучшение наблюдается уже на протяжении первых 2 недель выполнения правильно построенной программы. Неудача в лечении чаще всего объясняется прерывистым подкреплением неприемлемого поведения собаки. Такое подкрепление осуществляют члены семьи, если, к примеру, терпеливо переносят прыжки своего питомца, когда на них повседневная одежда. Прерывистый режим вознаграждения - идеальный способ поддерживать нежелательное поведение.

Недопустимое игровое поведение. Большинству людей нравится играть со своими собаками. Однако иногда владельцы жалуются на недопустимое поведение собаки во время игры. Дальнейший опрос нередко показывает, что собака играет бурно, прыгает на людей и хватает их зубами. Хотя игра - это забава, необходимо принимать меры, обеспечивающие безопасность и контроль. Как правило, собаки очень любят играть со своими хозяевами, и с ними нетрудно установить надлежащий режим игры.

Приглашение к игре. Приглашение к игре должно исходить от владельца; не следует начинать игру в ответ на требования собаки. О намерении владельца может сообщать вспомогательный вербальный сигнал типа "Пора нам поиграть!". Его можно комбинировать со вторичным сигналом, которым служит, например, переход на обычное место для игр или протягивание специальной игрушки или поводка.

Правила контакта. Необходимо установить правила физического контакта. Многим нравится бороться со своими собаками, но если собаке разрешить бороться с какими-то одними людьми, она, вполне вероятно, попытается делать это и с другими, включая маленьких детей и стариков. Поэтому не следует поощрять подобных игр. Если питомец настаивает, хозяину следует оставить его и прекратить игру. Нельзя также позволять собакам преследовать людей во время игры. Это может оказаться опасным, поскольку акт преследования может пробудить в животном хищное поведение. При этом жертвами часто становятся маленькие дети.

ПОЛОЖИТЕЛЬНОЕ И ОТРИЦАТЕЛЬНОЕ ПОДКРЕПЛЕНИЕ

С его помощью решаются следующие задачи:
1) формирование нового стереотипа поведения;
2) усиление уже имеющегося желательного стереотипа поведения;
3) ослабление нежелательного стереотипа поведения;
4) поддержание желательного стереотипа поведения в естественных условиях.
Обычно на практике решаются по крайней мере две задачи (вторая и четвертая или третья и четвертая), чаще же работа с пациентом направлена на реализацию второй, третьей и четвертой задачи.
Задача формирования нового стереотипа поведения обычно возникает в работе с детьми, отличающимися выраженным девиантным поведением, или с больными, имеющими грубые постпроцессуальные изменения личности.
Использование этих методик предполагает обязательный анализ каждого клинического случая в реальной ситуации, наблюдение за поведением больного или проявлениями его симптоматики в данных условиях. Это позволяет выявить подкрепляющие стимулы, которые различаются по параметру «приятный-неприятный». Положительное подкрепление - это предъявление стимула, вызывающего у пациента позитивно окрашенную эмоциональную реакцию, усиление определенных поведенческих реакций. Отрицательное подкрепление - это изъятие, удаление стимула, вызывающего негативно окрашенную эмоциональную реакцию, и поэтому также приводящее к усилению определенных поведенческих реакций. Два указанных выше понятия позволяют охарактеризовать подкрепляющий стимул по поведенческим данным, а не по субъективной оценке наблюдателя. С учетом этого становится ясно, почему, например, переживание боли у мазохиста является положительным подкреплением. Нейтральные стимулы - это стимулы, которые не оказывают воздействия на поведение, хотя, с субъективной точки зрения наблюдателя, могут вызывать положительную эмоциональную реакцию. Безусловные подкрепляющие стимулы не зависят от предшествующего обучения. Это стимулы, вызывающие врожденные реакции (пища, вода), к ним же можно отнести и определенный уровень сенсорной стимуляции. Подкрепляющая сила их зависит от периода депривации и возрастает при удлинении последнего. В повседневной жизни преобладают подкрепляющие стимулы, приобретающие указанные выше характеристики под влиянием процесса обучения, т. е. условные подкрепляющие стимулы. Чаще всего это социальные стимулы (внимание, похвала, одобрение, признание, положительная оценка и т. д.). Анализ конкретных случаев, например истерического приступа, позволяет отметить усиление и учащение приступов в определенных ситуациях, когда проявляется забота о пациенте, оказывается ему внимание (можно сказать - нежелательное внимание) со стороны окружающих, близких, соседей по палате, медицинского персонала. Наблюдение за поведением позволяет оценить также значение других подкрепляющих стимулов (время, проведенное перед телевизором, за беседой и др.). На основании этих данных формулируется конкретная гипотеза о характере подкрепляющего стимула. Удаление гипотетического подкрепляющего стимула позволяет проверить истинность гипотезы. Однако необходимо помнить, что после удаления подкрепляющего стимула всегда есть период, в течение которого нежелательное поведение возрастает как по частоте, так и по силе проявления. В это время пациент «выжимает» из окружающих нужный ему подкрепляющий стимул, а окружающие обычно не выдерживают его натиска и идут ему навстречу. Поэтому при данной методике психотерапевт должен привлекать членов семьи больного, персонал, т. е. активно организовывать «новое» окружение больного.
В методике собственно положительной тренировки можно выделить 4 этапа.
Первый этап - определение цели тренировки. К ее обсуждению привлекается не только пациент, но и лица, которые принимают участие в лечении и от которых зависит получение или неполучение подкрепления. По возможности таких людей должно быть немного, для того чтобы лучше контролировать все окружение больного, например, желательно поместить пациента в изолированную палату или в палату с минимальным числом больных. На этом же этапе должен быть определен и способ постоянного наблюдения за поведением пациента с фиксацией внимания на изменениях в терапевтическом направлении вырабатываемого стереотипа поведения. Нужно стремиться к тому, чтобы эта информация была максимально объективной.
На втором этапе основная задача состоит в определении того, какие стимулы (объекты или действия) будут служить в качестве подкрепления. Анализ реального поведения больного позволяет выявить значимость для него различных стимулов.
На третьем этапе вырабатывается желательный стереотип поведения, для чего создаются условия, облегчающие его формирование. Следует максимально использовать действие как положительного, так и отрицательного подкрепления. На первых порах применяется схема постоянного подкрепления, т. е. за каждое выполненное действие пациент получает подкрепление, характер которого постоянно меняется, чтобы не вызвать пресыщения. Иногда появление желательного поведения облегчается при демонстрации другими лицами соответствующего поведения (моделирование).
На четвертом этапе закрепляется выработанный стереотип поведения, чтобы он сохранился и тогда, когда больной окажется в реальной ситуации и когда будут иные условия подкрепления. Схема подкрепления меняется, используются схемы с вариабельным интервалом - наиболее устойчивые к угашению. Успех методики положительного подкрепления зависит от наличия точной информации о достигнутом прогрессе, что позволяет переходить к следующему этапу, к другой схеме подкрепления; от умения психотерапевта разнообразить подкрепление, используя все его формы, в том числе и социальное подкрепление.
Вариантом методики положительного подкрепления, приспособленной к условиям стационара, является жетонная система (token economy).
Методика контроля стимула основывается на положении о том, что связь между некоторыми стимулами и реакцией на них носит довольно жесткий характер. Появление такого стимула позволяет точно предсказать ответ. Поэтому, контролируя условия появления стимулов и предшествующих реакций, можно добиваться изменения поведения с меньшей затратой времени и сил, чем контролируя результаты самого поведения. События, предшествующие поведению, можно сгруппировать следующим образом: 1) дискриминантные стимулы, в прошлом связанные с определенным подкреплением; 2) облегчающие стимулы, вызывающие определенное поведение (например, новая прическа, новая одежда могут способствовать появлению желания общаться); 3) условия, увеличивающие силу подкрепления (обычно это период депривации какой-либо потребности, например период голода). Методика контроля стимула преследует следующие цели: 1) научить пациента идентифицировать дискриминантные и облегчающие стимулы в реальной ситуации, а также выявлять условия, увеличивающие подкрепление нежелательного поведения, и избегать их (например, установление связи различных ситуаций с едой - еда за просмотром телевизора, во время случайных встреч со знакомыми, разговора по телефону и т. д. - с последующим исключением этих стимулов, т. е. еда только в определенном месте и в определенное время); 2) научить пациента укреплять стимулы, связанные с правильным, желательным поведением (например, знание списка продуктов или блюд, имеющих низкую калорийность, и овладение умением пользоваться только этим списком; письменный учет калорийности позволяет быть еще более последовательным в достижении этой цели); 3) научить пациента умению манипулировать периодом депривации, не доводя его до уровня потери контроля.
Решить задачу уменьшения нежелательного стереотипа поведения можно с помощью нескольких методик:
1) методики наказания;
2) угашения;
3) насыщения;
4) лишения всех положительных подкреплений;
5) оценки ответа.
Угашение относится к поведенческим методикам и основано на принципе исчезновения реакции, положительно не подкрепляемой. Проходит оно те же этапы, что и при положительном или отрицательном подкреплении. Важным здесь представляется диагностический этап, когда устанавливаются аспекты окружения, подкрепляющие нежелательное поведение. Угашение предполагает лишение больного всех положительных подкреплений только данного нежелательного стереотипа поведения. Скорость угашения зависит от того, каким образом в реальной жизни раньше подкреплялся этот стереотип. Методика угашения требует значительного времени, потому что, прежде чем нежелательное поведение начинает угасать, оно проходит период первоначального возрастания по частоте и силе.
Методика насыщения основана на том, что поведение, даже положительно подкрепляемое, но продолжающееся в течение длительного времени, имеет тенденцию истощаться само, а положительное подкрепление теряет свою силу.
Лишение всех положительных подкреплений является одним из вариантов угашения. Наиболее эффективным способом считается изоляция, но в реальной жизни она практически сводится к социальной изоляции, например в случае удаления одного ребенка в другую комнату при сохранении окружения без изменения. Иногда такая изоляция вызывает положительное подкрепление или означает прекращение действия неприятного стимула, имевшегося в реальной ситуации (например, отсутствие столкновения ребенка с агрессивно проводящим свою линию родителем, т. е. фактически возникает ситуация негативного подкрепления).
Методику оценки ответа точнее можно было бы назвать методикой штрафов. Она используется только с положительным подкреплением, и суть ее сводится к уменьшению числа позитивных подкреплений за нежелательное поведение. Программа составляется таким образом, чтобы уменьшение определенных положительных подкреплений не могло быть легко заменено другими положительными подкреплениями. Система штрафов должна применяться как можно реже.
Данные приемы описаны отдельно лишь из методических соображении, в практической же работе ни один из них не применяется изолированно. Комбинации методик определяются целью проводимой программы, а искусство психотерапевта состоит в умелом использовании различных сочетаний применительно к каждому конкретному случаю.

Психотерапевтическая энциклопедия. - С.-Пб.: Питер . Б. Д. Карвасарский . 2000 .

Смотреть что такое "ПОЛОЖИТЕЛЬНОЕ И ОТРИЦАТЕЛЬНОЕ ПОДКРЕПЛЕНИЕ" в других словарях:

В контексте учения о высшей нервной деятельности П. называется сочетание безусловного раздражителя, вызывающего биологически значимую реакцию, с предваряющим ее индифферентным стимулом, что приводит к формированию классического условного… …

Формулировка «закона эффекта» Торндайка выглядит следующим образом. Закон эффекта гласит: ил неск. реакций на одну и ту же ситуацию, те, к рые сопровождаются или сменяются состоянием удовлетворения животного, будут, при прочих равных условиях,… … Психологическая энциклопедия

Подкрепление - 1) по И. П. Павлову, – безусловный раздражитель, вызывающий биологически значимую реакцию; в процессе сочетания индифферентного (условного) раздражителя и П. образуются условные рефлексы 1 го типа; 2) в оперантном научении – достижение… … Словарь дрессировщика

ПОДКРЕПЛЕНИЕ - (в пед.) система пед. мер, являющихся подтверждением правильности (положительное П.) или ошибочности (отрицательное П.) отдельных действий воспитанника или его поведения в целом. Это прежде всего система методов стимулирования, в частности… … Педагогический словарь

Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S >R), они разработали принцип О. о. (R >S), согласно которому поведение… … Психотерапевтическая энциклопедия

Положительное подкрепление и отрицательное подкрепление выполняют две совершенно различные функции в управлении поведением. С одной стороны, эти явления имеют решающее значение для научения, несмотря на то, что механизм такого воздействия до сих… … Психологическая энциклопедия

Давно известно, что на поведение влияют его последствия. Мы награждаем или наказываем людей, напр., чтобы они вели себя по другому. При оперантном обусловливании на поведение тж влияют его последствия, но этот процесс не является научением по… … Психологическая энциклопедия

Эта статья содержит незавершённый перевод с английского языка. Вы можете помочь проекту, переведя её до конца. Прикладной анализ поведения (англ. … Википедия

НАКАЗАНИЕ - 1. Любое событие, которое действует противоположно подкреплению, то есть положительное наказание сокращает вероятность реакций, вызвавших его, а отрицательное наказание повышает вероятность реакций, его прекративших. См. отрицательное… … Толковый словарь по психологии

Тип социального, психологического воздействия, социально психологический феномен, представляющий собой стремление изменить восприятие или поведение других людей при помощи скрытой, обманной или насильственной тактики. Поскольку такие… … Википедия