Режимы подкрепления
Режимы подкрепления
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное подкрепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений — обучение ребенка езде на велосипеде идет под настоящий поток: «Правильно, крепче держи руль, у тебя получилось, хорошо!» Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления.
Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, — то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение.
Мы не так уверены в этом только когда ставим целью добиться с помощью положительного подкрепления улучшения дисциплины. Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется — неважно сколь эпизодично — одна сигарета, одна рюмка, одна поблажка ворчуну или нытику — и поведение вместо того, чтобы угасаться, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами — она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, — но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты находят другого человека, в точности похожего на предыдущего.
Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они — жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в сексуальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. Посмотрите на ситуацию с точки зрения человека, управляющего поведением: я могу держать ее (его) в безоговорочном подчинении, так, «Чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет… изредка». Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила «очарования» по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Роль подкрепления в научении через наблюдение
Роль подкрепления в научении через наблюдение Другим источником разногласий в контексте научения через наблюдение является вопрос о роли подкрепления. Теории, ориентированные на подкрепление, предполагают, что ответные реакции, могут быть подкреплены в порядке
Объяснения косвенного подкрепления
Объяснения косвенного подкрепления Теория социального научения устанавливает некоторые механизмы, с помощью которых наблюдаемые вознаграждения и наказания вносят изменения в мысли, чувства и действия других людей (Bandura, 1971б). События, подразумевающие косвенные
Режимы подкрепления
Режимы подкрепления Еще один важный аспект оперантного обусловливания – идея о режимах подкрепления. Частота и момент выдачи подкрепления весьма существенно влияют на интенсивность закрепления нужного поведения и быстроту реакции; причем может использоваться
Тоталитарные режимы
Тоталитарные режимы Коммунистов стараются обвинить во всех грехах, в том числе и в тоталитаризме. На самом деле капиталистов пугает в коммунизме не тоталитаризм, а совсем другое. В мире было известно много тоталитарных режимов. Некоторые из них были установлены с
Интуитивное и логическое как режимы функционирования когнитивной системы
Интуитивное и логическое как режимы функционирования когнитивной системы В своем движении Пономарев не остановился на модели интуитивного и логического знания. Он пошел дальше и установил феномен интуитивного и логического режимов функционирования когнитивной
Режимы творческого мышления, ассоциативная сеть и распределенное внимание
Режимы творческого мышления, ассоциативная сеть и распределенное внимание Идеи механизмов, которые могут быть сопоставлены с интуитивным полюсом мышления, в современной психологии восходят к работам С. Медника. В начале 1960-х годов он предположил, что индивидуальные
Реальность подкрепления: закон сенсорной очевидности
Реальность подкрепления: закон сенсорной очевидности Холтофф усмехнулся:- Тогда бы никто не болтал, если бы у каждого был домик в горах, много хлеба с маслом и никаких бомбежек…Штирлиц внимательно посмотрел на Холтоффа, дождался, покатот, не выдержав его взгляда, начал
Время подачи подкрепления
Время подачи подкрепления Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление — это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное
Величина подкрепления
Величина подкрепления Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не
Исключения из правила вариативного подкрепления
Исключения из правила вариативного подкрепления Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, — это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки
Суеверия: случайные подкрепления
Суеверия: случайные подкрепления В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а
Чего можно добиться с помощью положительного подкрепления
Чего можно добиться с помощью положительного подкрепления Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем
Стимулы в качестве подкрепления: поведенческие цепи
Стимулы в качестве подкрепления: поведенческие цепи Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим:
Шаг 6. Метод шести шляп: учимся переключать мышление в различные режимы
Шаг 6. Метод шести шляп: учимся переключать мышление в различные режимы Очень жаль, но в магазине вы не купите шляпу, предназначенную регулярно дарить вам гениальные идеи. Это очень серьезное упущение нашей промышленности. Эдвард де Боно. Шесть шляп мышления Шесть шляп –
37. Избавьтесь от подкрепления плохого поведения
37. Избавьтесь от подкрепления плохого поведения Не забывайте: любое поведение, в том числе и неприемлемое, является приобретенным. Оно появилось и закрепилось по той причине, что у него были благоприятные, с точки зрения ребенка, последствия. Нежелательное поведение