Мы думаем не так, как мы думаем, что мы думаем
Мы думаем не так, как мы думаем, что мы думаем
Проблема фреймов существует не только у искусственного интеллекта. У человеческого — тоже. Как замечает психолог Дэниел Гилберт в своей книге «Спотыкаясь о счастье», когда мы представляем себя или окружающих в определенной ситуации, наш мозг отнюдь не выдает длиннющий перечень вопросов о всевозможных потенциально релевантных подробностях. Скорее, как усердный ассистент оживляет скучную презентацию Power Point имеющимися в фильмотеке материалами, так и наша «умозрительная симуляция» рассматриваемого события извлекает недостающие фрагменты из обширной базы воспоминаний, образов, опыта, культурных норм и воображаемых результатов{73}. В одном из обзоров покидавшие ресторан респонденты охотно расписывали униформу официантов или игравшую музыку — тогда как в действительности никакой музыки и никаких официантов-мужчин не было. В другом эксперименте учащиеся, которых спрашивали о цвете классной доски, вспоминали, что она зеленая, хотя на самом деле она была синей{74}. В третьем испытуемые систематически переоценивали как досаду от предполагаемых убытков, так и радость от предполагаемых прибылей{75}. В четвертом познакомившиеся по Интернету испытывали тем больше симпатий к потенциальному партнеру, чем меньше сведений о нем было доступно{76}. Во всех этих случаях необходима дополнительная информация. Но, поскольку процесс «заполнения пробелов» происходит мгновенно и не требует ни малейших усилий, обычно мы его не осознаем. Поэтому нам редко приходит в голову, что чего-то не хватает.
Проблема фреймов предостерегает: поступая так, мы склонны к совершению ошибок. И мы их совершаем. Постоянно. Но, в отличие от неудач в сфере искусственного интеллекта, промахи людей не столь вопиющи, и переписывать всю ментальную модель их мышления, к счастью, не приходится. Скорее, как воображаемый читатель «American Soldier» Пола Лазарсфельда нашел два противоположных результата равно очевидными, так и мы, узнав, как все обернулось, почти всегда можем определить ранее упущенные аспекты ситуации. Теперь-то они кажутся релевантными! Мы ожидали, что, выиграв в лотерею, будем счастливы, но вместо этого огорчены? Бесспорно, прогноз плохой. Но ко времени осознания ошибки мы уже располагаем новыми сведениями — скажем, обо всех тех родственниках, которые внезапно объявились с требованием денег. Тогда кажется, будь у нас эта информация раньше, мы бы предвосхитили свое нынешнее состояние верно и, возможно, никогда бы не купили лотерейный билет. Получается, вместо сомнения в собственной способности прогнозировать будущее мы делаем вывод, что просто упустили из виду нечто важное. О, эту ошибку мы ни в коем случае больше не допустим! — но, увы, совершаем ее снова и снова. Не важно, как часто нам не удается верно предсказать поведение окружающих: как только их поступки становятся известны, мы объясняем собственные заблуждения с точки зрения чего-то, о чем раньше понятия не имели. Таким образом, проблему фреймов весьма успешно удается замять — уж в следующий-то раз мы все сделаем правильно! Беда в том, что в действительности мы никогда не можем усвоить, что можем прогнозировать, а что — нет.
* * *
Нигде эта тенденция не является более очевидной и не поддается исключению труднее, чем во взаимосвязи материальных вознаграждений. Ни у кого не вызывает сомнений, что качество и эффективность работы служащего могут повышаться в ответ на соответствующие финансовые стимулы, — и в последние несколько десятков лет немалой популярностью стали пользоваться системы вознаграждений, основанные на результатах деятельности. В основном это касается резко увеличившихся вознаграждений руководства компаний, привязанных к курсу акций{77}. Разумеется, бесспорно и то, что трудящихся интересуют не только деньги. Следовательно, такие факторы, как удовольствие от работы, признание и карьерный рост, вроде бы тоже должны оказывать свое влияние. При прочих равных здравый смысл подсказывает: улучшить эффективность деятельности служащих можно соответствующими материальными вознаграждениями. И все-таки, как показал ряд исследований, взаимосвязь между оплатой и результатами является на удивление сложной.
Недавно мы с коллегой по Yahoo! Уинтером Мейсоном провели ряд интернет-экспериментов, в которых участникам платили различные суммы за выполнение простых однообразных задач.
Последние включали раскладывание по порядку фотографий уличного движения или нахождение слов, спрятанных в заполненном буквами поле. Всех своих испытуемых мы набрали с известного веб-сайта Mechanical Turk, который Amazon запустил в 2005 году для выявления дубликатов своих веб-страниц{78}.
Сегодня Mechanical Turk используется сотнями компаний, предлагающими широкий спектр задач — от называния предметов на картинке до характеристики «настроения» газетной статьи или выбора наиболее понятного объяснения из двух предложенных (так называемый краудсорсинг). Но Mechanical Turk — еще и потрясающе эффективный способ набирать испытуемых для психологических экспериментов. Ведь раньше психологи бегали по колледжам и распространяли листовки. А теперь, поскольку выполняющим подобную работу, как правило, платят всего несколько центов за задачу, траты составляют лишь незначительную долю обычной стоимости{79}.
В общей сложности наши эксперименты включали сотни участников, выполнявших десятки тысяч задач. В одних случаях им платили всего один цент (например, за сортировку одного ряда изображений или нахождение одного слова), тогда как в других — пять или даже 10 центов за то же самое. Разница в 10 раз представляет собой довольно существенное различие (для сравнения, средняя почасовая ставка компьютерного инженера в США лишь в шесть раз превышает минимальную), а значит, предположили мы, оно могло оказать серьезное влияние на поведение. И действительно, так оно и случилось. Чем больше мы платили испытуемым, тем больше задач они выполняли. Кроме того, для любой заданной ставки подопытные, получавшие «легкие» задачи (сортировка рядов из двух изображений), выполняли больше действий, чем испытуемые, получавшие «средние» или «трудные» задачи (три и четыре изображения в ряду соответственно). Все это согласуется с интуицией. Но вот в чем загвоздка: несмотря на эти различия, качество их работы — то есть точность, с которой участники сортировали изображения, — никак не изменялось в зависимости от уровня оплаты, хотя последней подлежали лишь те задания, которые были выполнены правильно{80}.
Чем же объяснялся подобный результат? Неясно. Однако после того, как люди заканчивали работу, мы задавали им несколько вопросов — в том числе и о том, сколько, по их мнению, они должны были бы получать. Любопытно, но ответы зависели от сложности задач меньше, чем от суммы, которую им платили. В среднем те, кому выдавали один цент за задание, думали, что им следовало платить пять центов; те, кому платили пять центов, полагали, что им следовало платить восемь; а те, кому выделяли 10, считали, что им следовало платить 13. Другими словами, сколько бы им ни причиталось (и, заметьте, одним — в 10 раз больше, чем другим), все были уверены, что им недоплачивают! О чем это говорит? О том, что даже в случае очень простых задач дополнительная мотивация к деятельности, возникающая благодаря финансовому поощрению, в основном уравновешивается обостренным чувством того, что за нее причитается.
Изучение этого эффекта вне лабораторных условий представляет определенные трудности: служащие большинства компаний четко понимают, сколько стоит их труд, и манипулировать этими представлениями практически невозможно. Но давайте немного пофантазируем. Допустим, за одну и ту же работу в США женщины получали бы в среднем на 10 % меньше мужчин. Или директора фирм в Америке зарабатывали бы существенно больше, чем в Европе{81}. Как бы там ни было, взялись бы вы утверждать, что низкооплачиваемая группа работает хуже высокооплачиваемой? Представьте, что в следующем году начальник вдруг удвоит вашу зарплату — насколько усерднее и больше вы станете работать? Вообразите параллельную вселенную, в которой банкиры получают вполовину меньше того, что получают у нас. Некоторые из них, безусловно, выберут другую профессию, а те, кто останется в банковской системе, — разве они будут трудиться меньше? Результат нашего эксперимента наводит на мысль, что нет, не будут. Но если так, то возникает вопрос: насколько сильное влияние могут оказать работодатели на качество и эффективность деятельности сотрудников путем изменения материальных стимулов? Стоит задуматься.
В ходе ряда исследований было обнаружено, что финансовые стимулы способны не только повысить, но и… снизить качество работы. Когда задача многогранна или сложно поддается измерению, сотрудники имеют тенденцию сосредотачиваться только на тех аспектах своей деятельности, которые подлежат активной оценке, упуская из виду другие важные моменты. Например, все мы знаем, что учителя нередко акцентируют внимание на материале, охватываемом стандартизованным тестом, — в ущерб общей программе. Кроме того, материальное поощрение само по себе может вызвать эффект давления, при котором психологическое воздействие вознаграждения сводит на нет обострившееся желание качественно выполнить работу. Наконец, в среде, где индивидуальные достижения сложно отделить от командных, система поощрений может привести к тому, что кто-то начнет прятаться за спинами других, отказываться от риска и т. д., что в итоге будет препятствовать инновациям. Суть всех этих смущающих и часто противоречивых находок заключается в следующем: хотя любой человек согласится, что все мы так или иначе реагируем на финансовые стимулы, как эффективно применять их на практике — неясно. Ряд специалистов в области менеджмента, потратив десятки лет на исследования и эксперименты, сделали вывод: на качество деятельности финансовые стимулы в основном влияния не оказывают{82}.
Впрочем, сколько бы об этом ни твердили, менеджеры, экономисты и политики продолжают действовать так, будто изменить человеческое поведение с помощью надлежащей системы стимулов возможно. Как пишет Стивен Левитт, «типичный экономист верит, что в мире не существует проблемы, которую он не мог бы решить, имея свободное время для создания точной схемы стимулов. Стимул — это пуля, рычаг, ключ: как правило, крошечный предмет с огромным потенциалом для изменения ситуации»{83}. Как ни странно, один из эпизодов, приводимых тем же Левиттом, — об учителях средней школы, подделывающих ответы учеников на итоговом тестировании, — представляет собой явную попытку правящих кругов улучшить качество преподавания путем введения системы вознаграждений на основе результатов работы. Чудовищные последствия этой инициативы — неприкрытое мошенничество, «натаскивание» на тест, фокусировка исключительно на маргинальных учениках, которым даже незначительное улучшение может дать дополнительный проходной балл, — заставляют остановиться и крепко-крепко призадуматься о нашей способности разрабатывать системы стимулов, вызывающих желаемое поведение{84}.
Но здравый смысл не ждет. Если какая-то конкретная система стимулов не работает, мы тут же делаем вывод: поощрения не те. Кстати, к этому же заключению пришел и Левитт, рассматривая закон «Ни одного отстающего ребенка». Следовательно, согласно тому же здравому смыслу, нужно всего-навсего принять правильную систему. Как будто в прошлый раз разрабатывали неправильную! Этот момент упускают из виду не только экономисты — мы все. Например, в одной недавно опубликованной статье, посвященной извечной проблеме несерьезного отношения политиков к финансовой ответственности, автор заключал: «Политики, как и банкиры, реагируют на стимулы». Решение предлагалось следующее: «Совместить интересы страны с интересами политиков, которые ею управляют»{85}. Вроде бы ничего сложного. Да вот беда: как признавал сам написавший статью журналист, история предыдущих попыток «починить» политику весьма и весьма неутешительна.
Согласно здравому смыслу, каждый поступок имеет свои причины. Возможно, так и есть. Но это не дает представления ни о том, как человек поведет себя дальше, ни каковы будут причины этого поведения{86}. Как только оно станет известно, причины, разумеется, тут же покажутся очевидными, и мы сделаем вывод: мол, знай мы заранее о некоем особом факторе, который в итоге оказался важным, нам бы удалось это поведение спрогнозировать. Postfactum всегда будет казаться, будто верная система стимулирования могла привести к желаемому результату. Увы, эта видимость предсказуемости задним числом глубоко обманчива. Причин тому две. Во-первых, проблема фреймов подразумевает: мы никогда не узнаем все, что может оказаться релевантным для той или иной ситуации. А во-вторых, согласно множеству психологических трудов, большая часть релевантного находится за пределами нашего осознания. Это вовсе не означает, что человеческое поведение абсолютно непредсказуемо, — как доказали психологи, на все типы стимулов люди реагируют вполне определенным образом. Дело в том, что вышеупомянутые возражения бросают вызов не только исследователям искусственного интеллекта, пытающимся воспроизвести рассуждения у роботов и компьютеров на основе здравого смысла, — они бросают вызов всей нашей мысленной модели принятия решений. И в том, и в другом случае проблема одна: мы думаем не так, как мы думаем, что мы думаем. И если эту задачу трудно решить, когда имеешь дело с поведением отдельных людей, то что же говорить о поведении групп?
Данный текст является ознакомительным фрагментом.