Виды научения
Виды научения
Классическое обусловливание
Основы классического обусловливания были созданы в начале XX века И. П. Павловым. В опытах Павлова условный стимул (звонок) сочетается с безусловным стимулом (кормление собаки), между ними устанавливается связь таким образом, что прежде нейтральный условный стимул (звонок) теперь вызывает условную реакцию (выделение слюны).
Прекрасным примером классического обусловливания является эксперимент Джона Б. Уотсона (J. B. Watson). В 1918 г. Уотсон начал лабораторные эксперименты с детьми, показывая, что опыт научения в детстве имеет длительный эффект. В одном опыте он сначала показал, что девятимесячный мальчик Альберт не боялся белой крысы, кролика и других белых объектов. Затем Уотсон ударял по стальному бруску рядом с головой Альберта каждый раз, когда появлялась белая крыса. После нескольких ударов Альберт при виде крысы начал вздрагивать, плакать и пытаться отползти. Подобным же образом он реагировал, когда Уотсон показывал ему другие белые объекты. В этом опыте он использовал классическое обусловливание: сочетая громкий звук (безусловный стимул) с предъявлением крысы (условный стимул), он вызывал новую реакцию – условную реакцию страха – на прежде нейтральное животное.
Этот опыт также демонстрирует феномен, открытый Павловым и называемый «генерализацией стимулов». Суть его состоит в том, что если развилась условная реакция, то ее будут вызывать также стимулы, похожие на условный. Уотсон продемонстрировал: ребенка можно приучить бояться того, что прежде представлялось безобидным, и этот страх будет распространяться на похожие объекты. Маленький Альберт стал испытывать страх ко всем меховым игрушкам. Из своих опытов Уотсон сделал вывод, что дети научаются всему, в том числе фобиям.
Другое понятие, пришедшее из лаборатории Павлова и имеющее отношение к поведенческой терапии, – это различение стимулов (или стимульная дискриминация). Благодаря этому процессу люди научаются различать похожие стимулы. Плач ребенка становится условным стимулом для матери: ее условная реакция может выражаться в том, что она просыпается от глубокого сна при малейшем волнении ребенка, но та же мать может глубоко спать, когда плачет чужой ребенок.
И еще один феномен, открытый Павловым и используемый в поведенческих процедурах. Условный стимул продолжает вызывать условную реакцию только в том случае, если хотя бы периодически появляется безусловный стимул. Если же условный стимул не подкрепляется безусловным, то сила условной реакции начинает уменьшаться. Постепенное исчезновение условной реакции в результате устранения связи между условным и безусловным стимулами называется «угасание».
Инструментальное, или оперантное, обусловливание
Не все виды научения можно объяснить классическим обусловливанием. При классическом обусловливании условный и безусловный стимулы предшествуют условной реакции. Но условные связи могут также возникать между реакциями и стимулами, которые следуют за ними, другими словами, между поведением и его последствиями. Например, собака научается «служить», чтобы получить угощение; ребенок научается говорить «пожалуйста», чтобы получить конфетку. Эти реакции являются инструментами для получения какой-то награды. Инструментальное обусловливание – это процедура научения, при которой реакции приводят к награждению или желаемому эффекту.
Принципы инструментального научения открыл американский психолог Эдвард Торндайк (Edward Thorndike) примерно в то время, когда Павлов проводил эксперименты в России. Животное – обычно голодная кошка, помещалась в специальную клетку, названную «загадкой», и должна была научиться какой-то реакции; например, наступить на маленький рычаг для того, чтобы открыть дверь и выйти наружу. Когда кошке это удавалось, она награждалась пищей и вновь возвращалась в ящик. После нескольких проб кошка спокойно подходила к рычагу, нажимала на него лапой, выходила через открытую дверь и ела.
Формирование реакции происходило путем проб и ошибок, как результат выбора нужного эталона поведения и последующего его закрепления. Научение, согласно Торндайку, управляется законом эффекта: поведение контролируется его результатами и последствиями; поведение, которое приводит к достижению положительного результата, удовлетворению, закрепляется, и наоборот – не приводящее к положительному результату стирается или ослабляется.
Спустя несколько десятилетий после опубликования работ Торндайка другой американский психолог, Б. Скиннер (B. Skinner), развил идеи своего предшественника. Скиннер подчеркивал, что при инструментальном обусловливании животное оперирует со средой, производит какое-нибудь движение, воздействует на среду. Поэтому процесс научения этим реакциям он назвал оперантным обусловливанием.
Для изучения оперантного обусловливания Б. Скиннер изобрел экспериментальную камеру, получившую название скиннеровского ящика. Камера звуко– и светонепроницаема, в ней поддерживается постоянная температура, и она полностью контролируется. Камера снабжена приспособлением, которым животное может оперировать для получения вознаграждения. Например, крыса, нажимая на рычаг, получает пищу из тонкой трубочки. Скиннеровский ящик позволил изучать отношения между реакцией и ее последствиями и анализировать, как эти последствия влияют на поведение.
Оперантное обусловливание подчеркивает, что поведение есть функция его последствий. Поведение усиливается позитивным или негативным подкреплением; оно ослабляется наказанием.
Позитивное подкрепление – это предъявление стимулов, которые усиливают реакцию. Иными словами, это награждение. Примером может служить учитель, который хвалит ребенка за прилежную учебу.
Негативное подкрепление – процесс усиления поведения путем изъятия, удаления негативных стимулов, таких как боль, скука, избыток тепла или холода и т. п. Примером может служить прием таблетки анальгина при головной боли. Другой пример: пациент, испытывающий страх в метро, может избежать этого переживания, оставшись дома.
Наказание. И позитивное и негативное подкрепления усиливают частоту реакции. Наказание уменьшает частоту реакции. Часто путают наказание и негативное подкрепление, но они совершенно различны. Подкрепление усиливает поведение, а наказание ослабляет его. Если ток выключается, когда крыса нажимает на рычаг, – это негативное подкрепление; оно увеличивает вероятность того, что крыса нажмет на педаль, когда ток снова включат. Но если ток включается, когда крыса нажимает на рычаг, то это наказание; менее вероятно, что крыса снова нажмет на рычаг.
Дискриминационное научение имеет место тогда, когда реакция награждается (или наказывается) в одной ситуации, но не награждается (не наказывается) – в другой. В таком случае говорят, что реакция (поведение) находится под контролем стимула. Этот процесс особенно важен в объяснении гибкости поведения в различных социальных ситуациях. Дискриминация (различение) стимулов позволяет научиться тому, что является подходящим (подкрепляемым) и неподходящим (неподкрепляемым) в данной ситуации. Например, ворчливая жена вряд ли будет бранить мужа в присутствии гостей.
Генерализация состоит в том, что поведение обнаруживается в иных ситуациях, а не только тех, в которых оно было приобретено. Например, терапевт может помочь пациенту стать более уверенным и экспрессивным во время терапии. Но цель терапии в том, чтобы пациент стал более уверенным в реальных жизненных ситуациях, другими словами, очень важно, чтобы произошла генерализация.
При сравнении классических и оперантных условных рефлексов видно, что, во-первых, классическое обусловливание требует повторного парного предъявления нейтрального стимула (звонок) и стимула, вызывающего врожденную, безусловную реакцию (пища). Обеспечение такого предъявления достигается участием экспериментатора. В экспериментах же с оперантным обусловливанием животное само осуществляет перебор стереотипов поведения и выбор стереотипа, приводящего к достижению результата, протекает активнее. Во-вторых, оперантные рефлексы контролируются их результатом; в экспериментах же с классическим обусловливанием появление условной реакции контролируется предъявлением предшествующего стимула. В реальной жизни большая часть обучения осуществляется по законам формирования оперантных условных рефлексов.
Социальное научение
Как правило, научение у людей имеет место тогда, когда они находятся с другими людьми. И в большинстве случаев научение следует принципам инструментального и классического обусловливания. Согласно традиционным взглядам на обусловливание, для того чтобы произошло научение, организм должен иметь непосредственный, личный опыт с сочетаниями стимулов или с последствиями реакций (поведения). Теоретики же социального научения утверждают, что люди также учатся на опыте других, посредством процессов, известных как викарное обусловливание и викарное научение (или моделирование).
Викарное обусловливание может быть классическим и инструментальным. Посредством викарного классического обусловливания, например, на основе поведения какого-либо человека у нас может возникнуть и закрепиться эмоциональная реакция на определенный стимул. Скажем, ваш друг восхищается каким-то писателем; его эмоция может действовать как безусловный стимул, который вызывает подобную же реакцию у вас (безусловную реакцию). Поскольку имя писателя сочетается с безусловным стимулом, то оно может стать для вас условным стимулом; и, хотя вы сами не читали книг этого писателя, его имя вызывает у вас положительную эмоциональную реакцию (условную реакцию).
Викарное инструментальное обусловливание демонстрируют опыты Альберта Бандура (Albert Bandura). Маленьким детям был показан короткий фильм с участием мужчины и большой надувной куклы. Мужчина бил куклу кулаком по лицу, молотком по голове, пинал ее, бросал в нее различные предметы. Но финалы в этом фильме были различными. Одни дети смотрели фильм с окончанием, в котором агрессивного героя другой мужчина назвал «чемпионом» и угощал сладостями и напитками; другие дети смотрели, как героя фильма ругали и называли «плохим человеком», и, наконец, третьи дети смотрели фильм, в котором не было ни награждения, ни наказания героя. После фильма каждому ребенку было позволено одному поиграть с куклой. Было обнаружено, что имитация агрессивной модели поведения была наибольшей у детей, которые наблюдали награждение. Таким образом, подкрепление, которое дети видели в фильме, но непосредственно не переживали, влияло на их поведение.
Опыты с куклой показали, что научение может осуществляться не только посредством прямого обусловливания, но также и посредством викарного (замещающего) обусловливания. Викарное научение – это способность обучаться новому поведению, наблюдая поведение других.
Бандура также показал, что дети научаются и имитируют поведение взрослых, даже если оно не сопровождается награждением. В одном эксперименте детям показывали фильмы, в которых мужчина или сидел спокойно рядом с куклой, или с неистовством набрасывался на нее. Потом детей оставляли одних в комнате с куклой. Те дети, которые наблюдали агрессивное поведение, были более агрессивны. Мало того, они в точности повторяли те формы агрессивного поведения, которые видели, то есть научение возможно без подкрепления. (Следовательно, закон эффекта Торндайка не является универсальным.)
Данный текст является ознакомительным фрагментом.