Правила управления с помощью стимулов
Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.
Например, предположим, что вы заставляете собаку садиться, надавливая на крестец и подтягивая за ошейник. Это безусловные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятельное проявление собакой этой позы, формируя соответствующее поведение. Делая это, вы произносите команду "Сидеть!", которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда станет выполнять это действие во время или после предъявления сигнала, или условного стимула, команды "Сидеть!". В конце концов она начнет выполнять действие точно в соответствии с тем, что ей приказывают.
Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обучить — и это специальная тренировочная задача — не садиться без команды. Установление управления поведением стимулами не является завершенным, пока оно совершается и в отсутствии условного сигнала.
Не рычите на собаку! 203
|
|
Это, конечно, не означает, что собака должна целый день стоять, пока вы не скомандуете: "Сидеть!". Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, "пуск" и "стоп" сигналы должны быть твердо установлены, чтобы выполнение команды было надежным.
Итак, полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки:
1. Поведение всегда осуществляется сразу после подачи условного стимула (собака садится, когда ей приказывают).
2. Поведение никогда не возникает в отсутствие стимула (во время занятий или работы собака никогда не садится спонтанно).
3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите:
"Лежать!", собака не должна садиться).
4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. "Сидеть!" собака не должна ложиться или скакать и лизать ваше лицо)
Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду "Сидеть!". Теперь вы действительно управляете ею с помощью стимула. <...>
|
|
Что может быть сигналом?
Условным стимулом — выученным сигналом — может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского — короче говоря, безразлично, какой сигнал вы используете. Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.
Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов руки, но я знаю одного слепого дельфина, который . выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку,
покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону.
|
|
У рыб можно выработать условный рефлекс на звуки или свет — мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно.
В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду "Каш!", даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег. И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах "Спокойно, крошка!", не имеет ни малейшего значения.
Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде "Вперед!". Тренер конюшни смотрел на это с отвращением и наконец сказал: "Так ничего не выйдет — лошади не понимают "Вперед!", надо цокать". Потом взял веревку у меня из рук, сказал: "Тцо-тцо" и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед. "Понятно?" — сказал он, считая свои слова доказанными.
|
|
Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!
Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо полу-
204 К. Прайор
чать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: "Тихо!", или встать и, подняв руку, жестом призвать к молчанию. А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.
Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим, команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал, поданный рукой,— и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано "Выполняй это действие" и "Выполняй это действие по команде", то легче выработать "Выполняй это действие также по другой команде". <...>
Время отставления
Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления. Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.
Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.
Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепля
ете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.
Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.
Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось. Пользуйтесь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.
В 1960 г. в океанариуме "Жизнь моря" одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать—двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала. В результате
Не рычите на собаку! 205
дельфины располагались вокруг подводного источника звука, навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, Сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, по-видимому, психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.
В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание — временное "окно", в течение которого должно осуществляться поведение, которое будет подкреплено, — очень короткое. <...>
Дата добавления: 2019-07-15; просмотров: 130; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!