Подкрепление в научении через наблюдение

We use cookies. Read the Privacy and Cookie Policy

Подкрепление в научении через наблюдение

Бандура полагает, что хотя подкрепление часто способствует научению, оно совсем не является обязательным для него. Существует множество других факторов, замечает он, отличных от подкрепляющих последствий, которые могут влиять на то, будет ли человек внимательно наблюдать. Нам не нужно ждать подкрепления, например, чтобы обратить внимание на пожарную сирену, вспышки молнии, неприятный запах, непривычные стимулы. Действительно, когда наше внимание к моделируемой деятельности достигается посредством абсолютного влияния физических стимулов, даже дополнительные позитивные мотивы не усиливают научение через наблюдение. Этот факт доказывается исследованием, показывающим, что дети, наблюдающие модельный процесс по телевидению в затемненной комнате, позже ведут себя сходным образом, независимо от того, было ли им известно заранее, что такая имитация будет поощрена. Говоря короче, прямое подкрепление может помочь моделированию, но не является необходимым для него (Bandura, 1986).

Бандура полагает, что понимание поведения человека только как контролируемого исключительно внешними последствиями будет слишком ограниченным: «Если бы действия определялись только внешними поощрениями и наказаниями, люди вели бы себя подобно флюгеру, постоянно вертясь в разные стороны, чтобы соответствовать прихотям других» (Bandura, 1971, р. 27). Таким образом, хотя теория социально — когнитивного научения действительно признает важную роль внешних подкреплений, она постулирует существование более широкого круга подкрепляющих воздействий. Люди не только подвержены влиянию опыта, приобретенного в результате своих действий, но и регулируют поведение на основе ожидаемых последствий, а также создают их для себя сами. Эти две формы подкреплений — косвенное и самоподкрепление — мы вкратце обсудим далее.

Бандура, анализируя роль подкрепления в научении через наблюдение, показывает его когнитивную ориентацию. В отличие от Скиннера, он утверждает, что внешнее подкрепление редко выступает в роли автоматического определителя поведения. Чаще оно выполняет две другие функции — информативную и побудительную. Подкрепление, следующее за реакцией, указывает или, по крайней мере, может указать человеку на необходимость сформировать гипотезу о том, что такое правильная реакция. Эта информативная функция, или обратная связь, может работать, когда подкрепление переживается прямо или косвенно. Возьмем такой пример: если вы являетесь свидетелем того, как кого — то наказывают за определенное деяние, это дает вам столько же информации, как если бы наказывали вас. Подкрепление сообщает нам, какие последствия можно ожидать в результате правильной или неправильной реакции. Если, например, ученица средней школы, которая хочет стать врачом, узнает, что она может получить отличную подготовку (подкрепление) на вводном курсе по медицине в колледже — это как раз такой случай. Этот вид информации — обычно называемой побудительной — имеет значение, если нам нужно правильно предвидеть возможные последствия наших действий и соответственно регулировать поведение. Действительно, без способности предвидеть вероятный исход будущих поступков люди действовали бы крайне непроизводительно, если не сказать рискованно.

Косвенное подкрепление

Из предыдущего обсуждения очевидно, что люди могут получить пользу от наблюдения успехов и поражений других так же, как из своего непосредственного опыта. Действительно, мы, как общественные индивиды, постоянно следим за действиями других людей и за ситуациями, в которых тех поощряют, игнорируют или наказывают. Возьмем, например, школьника, который наблюдает, как делают выговор однокласснику за то, что он мешает учителю. Данный пример, вероятно, послужит ему предостережением, если, конечно, этот ребенок не посчитает, что в его случае последствия могут быть другими. Или, например, официант, который видит, как его коллеги получают щедрые чаевые за дружелюбную улыбку и веселую болтовню с клиентами. Это, несомненно, может подвигнуть его на то, чтобы улыбнуться и поболтать с посетителем. Как показывают эти два примера, наблюдаемые или косвенные последствия (наказания и поощрения), подкрепляющие действия других, часто играют значительную роль в регуляции нашего поведения. Это означает, что пробы и ошибки оперантного обусловливания могут быть получены «из вторых рук». Преимущество этого принципа в том, что он не только позволяет нам экономить энергию, но также дает возможность учиться на ошибках и успехах других.

Косвенное подкрепление осуществляется всякий раз, когда наблюдатель видит действие модели с результатом, который наблюдатель осознает как результат предшествующих действий модели. Можно говорить о косвенном позитивном подкреплении, когда наблюдатели ведут себя таким же образом, как наблюдаемые ранее модели, получившие подкрепление, в то время как при косвенном наказании наблюдаемые аверсивные последствия снижают тенденцию вести себя подобным образом. В каждом примере информация, полученная от наблюдаемых последствий, позволяет наблюдателю определить, будет отдельный внешний подкрепляющий стимул являться поощрением или наказанием. Таким образом, если вы увидите, что кого — то поощряют за какие — то действия, вы, вероятно, придете к заключению, что получите такой же подкрепляющий стимул, если поступите так же. И наоборот, если вы увидите, что кого — то наказывают за что — то, вы, вероятно, придете к заключению, что то же самое случится с вами, если вы поступите сходным образом.

Самоподкрепление

До сих пор мы рассматривали, как люди регулируют свое поведение на основе внешних последствий, которые они либо наблюдают, либо испытывают непосредственно. С точки зрения социально — когнитивной теории, однако, многие наши поступки регулируются самоналагаемым подкреплением. Бандура утверждает даже, что в основном поведение человека регулируется посредством подкрепления самого себя (Bandura, 1988).

Самоподкрепление очевидно имеет место всякий раз, когда люди устанавливают для себя планку достижений и поощряют или наказывают себя за ее достижение, превышение или неудачу. При работе над книгой или статьей для публикации в журнале, например, авторам не требуется, чтобы кто — то стоял сзади и заглядывал через плечо, одобряя каждое предложение, пока не получится удовлетворительная рукопись. Они заранее знают, что должно получиться в конце работы, и постоянно редактируют себя, часто бывая излишне строгими. Во многих других областях деятельности люди аналогичным образом сами оценивают свое поведение и поощряют или наказывают себя. Они поздравляют себя со своими мыслями и поступками; они хвалят себя или разочаровываются в своих достоинствах; и они сами выбирают моральные и материальные поощрения и наказания из множества доступных им. Акцент Бандуры на самоподкреплении значительно повышает возможности объяснения поведения человека на основе принципов подкрепления.

Как появляется саморегулирование

Как мы видели, самоподкрепление — процесс, суть которого заключается в том, что люди награждают себя поощрениями, над которыми они имеют контроль, всякий раз, когда достигают установленной ими самими нормы поведения. Так как можно реагировать и негативно, и позитивно, Бандура использует термин саморегулирование для обозначения усиливающего и уменьшающего эффекта самооценки (Bandura, 1989b).

С точки зрения Бандуры, саморегулируемые побуждения усиливают поведение в основном через свою мотивационную функцию. То есть, в результате самоудовлетворения от достижения определенных целей, у человека появляется мотив прилагать все больше усилий, необходимых для достижения желаемого поведения. Уровень самопроизвольной мотивации человека обычно варьирует в соответствии с типом и ценностью побуждений и природой норм поведения. По Бандуре, есть три процесса, входящие компонентами в саморегулирование поведения: процесс самонаблюдения, самооценки и самоответа.

Поведение человека меняется по ряду параметров самонаблюдения (например, качество или скорость реакций). Функциональная значимость этих величин зависит от типа рассматриваемой деятельности. Например, атлетические соревнования оценивают в терминах времени и расстояния. А об артистичности обычно судят, основываясь на эстетической ценности и оригинальности. Социальное поведение обычно оценивается в таких величинах, как искренность, девиантность, нравственность и другие.

Второй компонент, вовлеченный в поведение саморегулирования, — самооценка. Часто бывает, что поведение рассматривается как достойное одобрения и, следовательно, поощряемое или как неудовлетворительное и наказуемое, в зависимости от того, с позиций каких личностных стандартов оно оценивается. Вообще поступки, соответствующие внутренним нормам, считаются позитивными, а не соответствующие — негативными. Очень часто оценка поведения по абсолютным показателям является неадекватной. Время, показанное при заплыве на 100 метров свободным стилем, количество правильных ответов на экзамене по биологии или сумма, пожертвованная благотворительной организации, часто не дают достаточной информации для самооценки при сопоставлении с внутренними нормами. В этих и многих других примерах адекватность поведения должна быть определена относительно (например, в сравнении с поведением других). Эту мысль можно проиллюстрировать на примере студентки, ответившей правильно на 85 вопросов на экзамене по биологии и желающей быть в числе 5 % лучших учеников в классе. Ясно, что количество ее правильных ответов не дает возможности ни для позитивной, ни для негативной самооценки, если она не знает, как отвечали ее одноклассники. В других случаях адекватность нашего поведения можно определить в терминах стандартных норм или ценностей эталонной группы.

Поведение человека в прошлом также является стандартом, в соответствии с которым можно оценить адекватность его поведения на сегодняшний день. Здесь ориентир для оценки адекватности или неадекватности дает сравнение со своим собственным поведением. Бандура предполагает, что прошлое поведение влияет на самооценку в основном посредством его воздействия на постановку целей: «После того, как данный уровень поведения достигнут, он больше не требуется, и человек начинает искать нового самоудовлетворения. Люди хотят повысить нормы поведения после успеха и понизить их, чтобы приблизиться к более реалистичному уровню, после неоднократных неудач» (Bandura, 1977b, p. 132).

Оценка деятельности — другой ключевой фактор в критическом компоненте саморегулирования поведения. Очевидно, например, что люди прилагают мало усилий или вообще не утруждают себя в деятельности, которая не касается их лично. А в тех сферах жизни, которые влияют на их благополучие и самоуважение, самооценка производится постоянно. То, каким образом люди воспринимают причины своего поведения, в значительной степени влияет на самооценку. Большинство людей чувствуют гордость и удовольствие от достижений, которые они относят за счет своих способностей и усилий. И наоборот, они редко бывают удовлетворены, когда относят свой успех за счет внешних факторов, таких как случай или везение. Это справедливо и для их суждений о неудачах, о поведении, заслуживающем порицания. Люди самокритично реагируют на неприятности, виной которым было их собственное поведение, но не на ошибки, которые, как они считают, происходят из — за оправдывающих их обстоятельств или недостатка возможностей. Полагают, что достижения, не имеющие отношения к нам самим, обычно не порождают определенных реакций. Например, если человек достигает положения первой трубы в оркестре, он, вероятно, полагает, что это произошло благодаря его опыту и музыкальным способностям. Однако тот же самый человек будет меньше гордиться своим достижением, если осознает, что этим он обязан отцу — дирижеру, а не собственному дарованию. Если бы он не удостоился подобной чести, то мог бы оправдать свою плохую игру тем, что болел гриппом во время репетиций. Барабанщика же, занимающего позицию стороннего наблюдателя, все это в целом мало волнует.

Бандура утверждает, что широкий спектр поведения человека регулируется с помощью реакций самооценки, выражаемых в форме удовлетворенности собой, гордости своими успехами, неудовлетворенности собой и самокритики (Bandura, 1977b, 1982). Таким образом, третий и последний компонент, вовлеченный в поведенческое саморегулирование, касается процессов самоответа, в особенности результатов самооценки. При прочих равных условиях позитивная самооценка поведения приводит к поощряющему типу реагирования, а негативная оценка — к наказывающему. И более того, «реакции самооценки приобретают и сохраняют критерии поощрения и наказания в зависимости от реальных последствий. Люди обычно удовлетворены собой, если испытывают гордость от своих успехов, но не довольны собой, когда что — то осуждают в себе» (Bandura, 1977b, p. 133).

Бандура полагает, что адекватная теория поведения должна также рассматривать такие сложные вопросы, как: почему люди отказываются поощрять себя, почему они требовательны к себе, когда никто не принуждает их к этому, и почему они наказывают себя. Действительно, это вопросы, требующие разъяснения, и Бандура охотно признает, что они еще не достаточно изучены (Bandura, 1977b, 1986). Далее следуют некоторые гипотетические объяснения, предложенные Бандурой.

Почему мы наказываем себя. С социально — когнитивной точки зрения, люди склонны тревожиться и осуждать себя, когда нарушают свои внутренние нормы поведения. Они неоднократно переживают в ходе социализации такую последовательность событий: проступок — внутренний дискомфорт — наказание — облегчение. В этом случае действия, не соответствующие внутренним нормам поведения, вызывают тревожные предчувствия и самоосуждение, не проходящие до тех пор, пока не наступит наказание. Оно, в свою очередь, не только кладет конец страданиям от проступка и его возможных социальных последствий, но также направлено на то, чтобы вернуть одобрение других. Соответственно, самонаказание избавляет от внутреннего дискомфорта и дурных предчувствий, которые могут длиться дольше и переноситься более тяжело, чем само наказание. Реакции самонаказания сохраняются долго, так как они смягчают душевную боль и ослабляют внешнее наказание. Осуждая себя за недостойные в моральном отношении поступки, люди перестают терзаться из — за прошлого поведения. Самокритика может также уменьшить терзания по поводу неправильного или разочаровывающего поведения. Другая причина использования самокритики — то, что она часто является эффективным средством уменьшить негативные реакции других. Иначе говоря, когда есть вероятность, что определенные поступки приведут к дисциплинарным мерам, самонаказание может оказаться меньшим из двух зол. И наконец, вербальное самонаказание может использоваться с целью услышать похвалу от других. Осуждая и принижая себя, индивид может вынудить других людей высказаться по поводу его положительных качеств и способностей и заверить, что ему нужно постараться и все будет хорошо.

Хотя самонаказание может положить конец тревожным мыслям или, по крайней мере, ослабить их, оно также может усилить личный дискомфорт. Действительно, чрезмерное или длительное самонаказание, основанное на излишне строгих нормах самооценки, может вызвать хроническую депрессию, апатию, ощущение никчемности и отсутствия цели. В качестве примера можно вспомнить людей, страдающих от значительной недооценки себя вследствие потери ловкости из — за старения или каких — то физических увечий, но продолжающих придерживаться прежних норм поведения. Они могут принижать себя и свои успехи настолько, что в конце концов становятся апатичными и оставляют деятельность, которая раньше приносила им большое удовлетворение. Поведение, являющееся источником внутреннего дискомфорта, может также способствовать развитию различных форм психопатологии. Например, люди, постоянно чувствующие собственную неадекватность и испытывающие неудачи, могут стать алкоголиками или пристраститься к наркотикам, таким образом пытаясь совладать с окружением. Другие могут защитить себя от самокритики, уйдя в мир грез, где они получают в несбыточных фантазиях то, что недостижимо в реальности. Бандура (Bandura, 1988) полагает, что неадаптивное поведение — это результат излишне строгих внутренних норм самооценки.

Самоэффективность: путь к совершенному поведению

В последние годы Бандура ввел в свои теоретические построения постулат когнитивного механизма самоэффективности для объяснения личностного функционирования и изменения (Bandura, 1977a, 1989b, 1989c). Концепция самоэффективности относится к умению людей осознавать свои способности выстраивать поведение, соответствующее специфической задаче или ситуации. С точки зрения Бандуры, самоэффективность, или осознанная способность справиться со специфическими ситуациями, влияет на несколько аспектов психосоциального функционирования. То, как человек оценивает собственную эффективность, определяет для него расширение или ограничение возможности выбора деятельности, усилия, которые ему придется приложить для преодоления препятствий и фрустраций, настойчивость, с которой он будет решать какую — то задачу. Короче говоря, самооценка эффективности влияет на формы поведения, мотивацию, выстраивание поведения и возникновение эмоций.

По мнению Бандуры, люди, осознающие свою самоэффективность, прилагают больше усилий для выполнения сложных дел, чем люди, испытывающие серьезные сомнения в своих возможностях. В свою очередь, высокая самоэффективность, связанная с ожиданиями успеха, обычно ведет к хорошему результату и таким образом способствует самоуважению. Напротив, низкая самоэффективность, связанная с ожиданием провала, обычно приводит к неудаче и таким образом снижает самоуважение. С этой точки зрения, люди, считающие себя неспособными справиться со сложными или опасными ситуациями, вероятно, будут уделять чрезмерное внимание своим личным недостаткам и постоянно изнурять себя самокритикой по поводу собственной некомпетентности. Бандура говорит, что те, кто считает себя «неспособными добиться успеха, более склонны к мысленному представлению неудачного сценария и сосредоточиваются на том, что все будет плохо. Уверенность в неспособности добиться успеха ослабляет мотивацию и мешает выстраивать поведение» (Bandura, 1989с, р. 729). Напротив, люди, верящие в свою способность решить проблему, вероятно, будут настойчивы в достижении своих целей, несмотря на препятствия, и не будут склонны предаваться самокритике. Как замечает Бандура, «те, кто обладает сознанием высокой самоэффективности, мысленно представляют себе удачный сценарий, обеспечивающий позитивные ориентиры для выстраивания поведения, и осознанно репетируют успешные решения потенциальных проблем» (Bandura, 1989c, р. 729).

Бандура (Bandura, 1989b, 1989с) предположил, что приобретение самоэффективности может происходить любым из четырех путей (или любой их комбинации): способности выстроить поведение, косвенного опыта, вербального убеждения и состояния физического (эмоционального) возбуждения. Рассмотрим каждый из этих четырех факторов.

1. Способность выстроить поведение. Бандура утверждает, что наиболее важным источником эффективности является прошлый опыт успеха и неудач в попытке достичь желаемых результатов. Попросту говоря, успешный личный опыт порождает высокие ожидания, а предыдущие неудачи порождают низкие ожидания. Эстрадный артист, которого вдруг обуял страх перед выступлением, может сказать себе, что он уже выступал много раз без каких — либо происшествий и конечно сумеет сделать это опять. С другой стороны, люди, страдающие от неуверенности в своей способности выступать перед аудиторией из — за неудачи в прошлом, могут прийти к заключению, что им это просто не дано. Конечно, если человеку с низкой самоэффективностью дать какой — то стимул сделать то, чего он боится, самоэффективность будет усиливаться.

2. Косвенный опыт. Хотя и не столь действенный, как фактическое поведение, косвенный опыт также может быть источником высокой самоэффективности. То есть наблюдение за другими людьми, успешно выстраивающими поведение, может вселить в человека надежду на самоэффективность и уверенность, что с подобной деятельностью вполне можно справиться. Студенты, которые боятся задавать вопросы в большом классе, могут, например, изменить прогноз эффективности с «я не могу сделать это» на «возможно, я смогу», если они были свидетелями того, как их товарищи задавали вопросы без катастрофических последствий для себя. В то же время, если человек наблюдает за тем, как другие столь же компетентные люди неоднократно терпят неудачу, несмотря на настойчивые попытки, это, по всей вероятности, ухудшит его прогноз собственной способности выполнить подобные действия.

3. Вербальное убеждение. Эффективность может также быть достигнута или изменена через убеждение человека в том, что он обладает способностями, необходимыми для достижения цели. Возьмем мать, которая уверяет дочь, что она может справиться с трудным предметом в школе. Вербальная поддержка не просто помогает дочери поверить, что ей по силам «сделать это», но и может способствовать развитию навыков учения и концентрации усилий, ведущих к конечному успеху. Конечно, такая уверенность может с легкостью исчезнуть, если фактические успехи в освоении трудного предмета не соответствуют ожидаемому результату. Более того, вербальное воздействие на ребенка, который пытается добиться какого — то результата, должно быть в рамках его реальных возможностей и способностей. Если не следовать этому правилу, то попытка помочь, возможно, напротив, подорвет веру в родителя и оставит ребенка с пониженным прогнозом эффективности. Бандура выдвигает гипотезу о том, что сила вербального убеждения ограничивается осознаваемым статусом и авторитетом убеждающего. Терапевт может убедить чересчур полного пациента поменьше есть и побольше заниматься физическими упражнениями; но тот же самый терапевт вряд ли сможет убедить клиента в том, что тот способен влезть на Эверест.

4. Эмоциональный подъем. И наконец, так как люди сверяют уровень эффективности с уровнем эмоционального напряжения перед лицом стрессовых или угрожающих ситуаций, любой способ, понижающий возбуждение, повысит прогноз эффективности. Человек, испытывающий неуверенность при общении с женщинами, может почувствовать, как его сердце начинает ускоренно биться и ладони становятся мокрыми, когда он звонит женщине, назначая ей свидание. Если он относит эти физиологические реакции к тревоге, он может решить, что слишком нервничает, чтобы вынести все это. Если, однако, он замечает, что вполне спокоен, набирая номер, то может решить, что он более эффективен, чем полагал. Как видно из данного примера, люди с большей вероятностью добиваются успеха, если они не напряжены и эмоционально спокойны.