Десять правил выработки
Десять правил выработки
С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые — по крайней мере четыре первых — берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них:
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т. е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
4. Вводя новый критерий, временно ослабьте старые.
5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.
6. Не меняйте тренеров на «середине реки»; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.
7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.
8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.
9. Если навык ухудшается, «возвратитесь к детскому саду», быстро повторите весь процесс выработки с серией легких подкреплений.
10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.
1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъекту. Если ваша лошадь берет барьер в два фута, иногда имея фут в запасе вы можете увеличить барьер до двух с половиной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в состоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье.
То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь большое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепрыгивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ваше взаимодействие в процессе выработки, каковы ваши правила подкрепления.
Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать подкрепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным).
Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне.
Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас — неважно делал или не делал он это для себя, — вы сильно рискуете. Поведение может быть сорвано.
У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый — а иногда единственный — способ сформировать поведение — это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение.
Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и C. Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью — в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т. д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз — потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу требовать соблюдения обоих.
У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, — чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее, и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т. д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени.
Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю, что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления.
Часто нам не удается добиться прогресса в каком-либо навыке, хотя мы много упражняемся, потому, что мы пытаемся сразу улучшить две или более стороны деятельности.
Нужно подумать: одно ли свойство характеризует данное поведение? Нельзя ли его расчленить и работать отдельно над различными критериями? Когда вы займетесь этими вопросами, большинство проблем решаться сами собой.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь вариативной шкалой подкреплений имеющегося в данный момент уровня ответа.
Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление «сдвинет» нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением — когда достигнут новый уровень выполнения — и вариативным подкреплением — когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов.
Иногда смена стабильных и вариативных шкал происходит очень быстро, составляя два-три подкрепления на каждом уровне. Вероятность этого особенно велика, если у субъекта внезапно наступает «озарение» — он начинает понимать конечную цель, и улучшение поведения становится спонтанным. В этом случае введение вариативной шкалы столь значимо для обучения, что это необходимо постоянно помнить и все время контролировать, не забуксовала ли, не перестала ли приносить успех ваша программа выработки.
4. Вводя новый критерий, временно ослабьте старые.
Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью — послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится.
То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это «синдромом нового бассейна». Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он «забудет» все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают, а иногда фиксируют внимание на ошибках, которые становятся постоянными.
5. Ведите ученика за собой.
Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов.
Такого рода «рывок» выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в данном случае — прыгнуть как можно выше), и делает это.
Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию.
Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять.
«Рывок» часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от «ага!» познания, и часто впадает в состояние явно повышенного настроения. Таким образом, «рывок» — это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, — лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания.
За очень редкими исключениями наша школьная система построена так, чтобы помешать детям обучаться в их собственном темпе — наказываются не только медленные ученики, у которых не хватает времени на обучение, но и слишком быстро обучающиеся, которые не получают дополнительного подкрепления, когда быстрая сообразительность продвигает их вперед. Если ты мгновенно понял, о чем толкует учитель математики, твоей наградой может стать мучение от скуки в течение часов или даже недель, пока все остальные мало-помалу постигнут это. Поэтому нет ничего удивительного в том, что улица более привлекательна как для наиболее быстрых, так и для медленных.
6. Не меняйте тренеров на полпути.
В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям.
Конечно, у каждого обучающегося может быть много различных учителей — мы не испытываем затруднений от того, что один обучает нас французскому, другой — арифметике, третий — футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи.
Те, кто хочет учиться, будут учиться при наихудших условиях.
В Колумбийском университете был поставлен получивший в настоящее время широкую известность эксперимент по «языку обезьян», в котором шимпанзе обучали словарю американского знакового языка и другим кодам; в эксперименте принимал участие детеныш шимпанзе по имени Ним Шимрски. По бюджетным и другим соображениям, у бедняжки за трехлетний период было чуть ли не сто «учителей» знакового обозначения. Студенты и экспериментаторы были разочарованы, поскольку Ним не демонстрировал твердых доказательств использования реального «языка». А именно, он, по-видимому, никогда не строил предложений. Но он выучился распознавать и понимать более трехсот символов — существительных, глаголов и т. д., что при данных обстоятельствах, с моей точки зрения, является поразительным. То же самое происходит с некоторыми детьми, которые переходят из школы в школу, проходя через бесконечную смену учителей, приемов и методов обучения, и тем не менее обучаются. Но есть более хорошие способы.
Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены.
7. Если одна процедура выработки не приводит к успеху, попробуйте другую.
Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие — быстро опускать в воду и поднимать обратно лицо, а третьи — прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов.
Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому — вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать — надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение «рецепты» считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга.
Однажды один телевизионный деятель, который ставил шоу в океанариуме «Жизнь моря», пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лошадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама.
Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления — что за мысль!
Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом — нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл.
8. Не кончайте урок без положительного подкрепления, это равносильно наказанию.
Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, — поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации — скажем, на уроке или при выработке поведения у какого-либо животного — преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это — хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, или просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание — лучший способ сделать это.
Дрессировщики дельфинов называют это «тайм-аут» и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту — один из способов сказать дельфину: «Нет!» или: «Неправильно!» Обычно это оказывается очень эффективным — не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания — мощный инструмент, поэтому не применяйте его без должной осторожности и несправедливо.
9. Если выученное поведение ухудшается, пересмотрите процедуру выработки.
Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение — например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу — вы стараетесь найти испанское слово, а всплывает немецкое.
Самый быстрый способ исправить такое ухудшение — не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т. д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме «Жизнь моря» мы называли это «вернуться в детский сад», и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков. Оно действенно как у животных, так и у людей.
10. Прекращайте работу, оставляя за собой лидирующее положение.
Сколько должен продолжаться каждый сеанс выработки?
Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день.
Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте — т. е. сразу как только достигнут успех.
Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших ответа — собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж — и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться.
Будучи тренером вы должны, если это необходимо, заставлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше.
Психологи называют это «латентным обучением». В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение.
В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления.
Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди.