Глава 2 Предсказания дофамина

Глава 2

Предсказания дофамина

Ранним утром 24 февраля 1991 года Первая и Вторая дивизии морской пехоты двигались на север через пустыню Саудовской Аравии. Приблизившись к никак не обозначенной границе с Кувейтом — вокруг протиралась лишь бесплодная песчаная гладь, — военные увеличили скорость. Эти морские пехотинцы были первыми представителями сил Коалиции, вошедшими в страну с момента ее оккупации Ираком больше восьми месяцев назад. Исход операции «Буря в пустыне» зависел от их успеха. Военным нужно было освободить Кувейт и сделать это меньше чем за сто часов. Если бы им не удалось быстро расправиться с иракской армией, их ожидали боевые действия в городе. Иракцы угрожали отступить на улицы Эль-Кувейта, и если бы это произошло, наземная война могла затянуться на многие месяцы.

Морские пехотинцы ожидали сильного сопротивления. Иракские военные укрепили многие свои позиции в Кувейте, сосредоточив силы рядом с нефтяным месторождением Эль-Вафра, расположенным вдоль границы с Саудовской Аравией. Они заминировали значительную часть пустыни. Ситуация усложнялась еще и тем, что иракские части могли не опасаться атаки с воздуха. Так как силы Коалиции стремились минимизировать ущерб и жертвы среди мирного населения, бомбежки оккупированной территории были строго ограничены. В отличие от войск Республиканской гвардии в южной части Ирака, после тридцати семи дней бомбардировок понесших серьезные потери, силы, ожидавшие сейчас морских пехотинцев, находились в отличной боевой форме. По оценкам Объединенного центрального командования (ОЦК), во время вторжения в Кувейт потери каждой дивизии морской пехоты должны были составить примерно тысячу человек — 5-10 % от их общей численности.

Чтобы оказать морпехам поддержку в их крайне рискованной миссии, эскадра коалиционных линкоров и эсминцев был размещена менее чем в двадцати милях от побережья Кувейта. Это был рискованный стратегический ход: хотя большие корабельные орудия могли прикрыть наземную атаку, сами они оказывались при этом в зоне попадания иракских ракет. В то утро, когда морская пехота начала вторжение в Кувейт, американские и британские корабли в Персидском заливе были приведены в состояние наивысшей боеготовности. Им был дан приказ ожидать огня противника.

Первые двадцать четыре часа наземной операции превзошли самые смелые ожидания ОЦК. Прорвавшись через иракские мины и колючую проволоку, дивизия морской пехоты смогла продвинуться вглубь центральной части Кувейта. В отличие от советских танков Т-72, использовавшихся иракской армией, американские танки Mi «Абрамс» были оснащены системами GPS и тепловизионными прицелами, позволяющими морским пехотинцам воевать даже темной ночью. После того как отряд достиг окраин Эль-Кувейта, он сделал резкий поворот на восток и приступил к выполнению задачи по обеспечению безопасности береговой линии. Прямо перед рассветом 25 февраля десять вертолетов морской пехоты вместе с одним универсальным десантным кораблем провели ложную атаку на военную базу вблизи кувейтского порта Аш-Шуайба. Атаку поддерживал заградительный артиллеристский огонь со стоящих недалеко от берега линкоров. Силы Коалиции не стремились захватить порт, они просто хотели «нейтрализовать» его и убедиться в том, что он не представлял опасности для стоящего в море конвоя.

В то же самое утро, когда шла атака на Аш-Шуайба, капитан-лейтенант Майкл Райли наблюдал за экранами радаров на борту «Глостера», британского эсминца, стоявшего примерно в пятнадцати милях от порта. В боевую задачу «Глостера» входила защита союзнической эскадры, поэтому Райли должен был мониторить все воздушное пространство вокруг морского конвоя. С самого начала воздушной войны команды радиолокационщиков жили по изнурительному расписанию. Они дежурили по шесть часов, потом у них было шесть часов на еду и сон, а после этой короткой передышки они вновь отправлялись в клаустрофобическую радиолокационную рубку. К моменту наземного вторжения у них начали проявляться признаки переутомления. У всех были красные глаза, и все нуждались в больших дозах кофеина.

Райли дежурил с полуночи. В 5:01 утра, как раз когда корабли союзников начали бомбардировку Аш-Шуайба, он заметил на экране радара яркую точку недалеко от побережья Кувейта. Быстрые расчеты ее траектории показали, что она направляется прямо к конвою. Хотя Райли смотрел на похожие точки всю ночь, в этой черточке на радаре было что-то такое, что сразу вызвало у него подозрение. Он не мог объяснить почему, но вид этой мигающей зеленой точки на экране наполнил его ужасом, у него участилось сердцебиение, а ладони стали влажными. Он продолжал наблюдать за приближающейся точкой еще сорок секунд — она медленно приближалась к американскому линкору «Миссури». С каждым поворотом радара расстояние сокращалось. Она приближалась к американскому кораблю со скоростью более 550 миль в час. Если бы Райли пошел на поводу у собственного страха и решил сбить эту цель, ему нужно было действовать немедленно. Если бы точка оказлась ракетой, промедление Райли обернулось бы трагедией. Сотни моряков погибли бы, американский корабль «Миссури» пошел бы ко дну, а Райли оставалось бы только стоять и смотреть, как это происходит.

Но у Райли была одна сложность. Точка на радаре находилась в той части воздушного пространства, где часто летали американские военные самолеты А-6, осуществлявшие по распоряжению Военно-морского флота США поддержку наземной операции при помощи бомб с лазерной системой наведения. После выполнения задания самолеты летели обратно к кувейтскому побережью, сворачивали на восток по направлению к конвою и садились на авианосцы. На протяжении нескольких последних недель Райли наблюдал десятки истребителей А-6, проделывавших тот же путь, что и эта неопознанная точка на радаре. Точка также шла с той же скоростью, что и самолеты, и имела похожую площадь поверхности. На экране радара она выглядела точно как А-6.

Чтобы еще больше усложнить ситуацию, пилоты А-6 взяли за правило отключать на обратном пути электронную опознавательную систему. Эта система позволяла силам Коалиции опознавать свои самолеты, но в то же время делала их более уязвимыми для иракских зениток. Неудивительно, что, пролетая над воздушным пространством, которое контролировал Ирак, пилоты предпочитали облачиться в «плащ безмолвия». Как результат, команда в радиолокационной рубке на борту «Глостера» не имела возможности установить связь с точкой на экране.

Оставался последний способ, с помощью которого радиолокационные команды могли понять, что же перед ними — приближающаяся ракета или свой самолет: нужно было определить высоту точки. А-6 обычно летали на высоте около трех тысяч футов, тогда как ракеты «Шелкопряд» шли на одной тысяче. Однако тот тип радаров, который использовал Райли, не отображал высоту полета приближающейся точки. Чтобы узнать высоту конкретного объекта, капитан-лейтенанту нужно было использовать специализированную радарную систему, известную как 909 и производившую поиск в горизонтальном диапазоне. К сожалению, оператор радара 909 задал неверный номер отслеживания вскоре после появления точки, так что Райли никак не мог узнать высоту летящего объекта. К этому мгновению он наблюдал за точкой на экране радара уже почти минуту, но ее значение по-прежнему оставалось для него тайной.

Цель двигалась быстро. Время на раздумье закончилось. Райли отдал приказ открыть огонь: две ракеты класса «земля — воздух» системы Sea Dart взмыли в небо. Шли секунды. Рейли нервно смотрел на экран радара, наблюдая, как его ракеты мчатся к неопознанному объекту со скоростью, приближающейся к скорости звука. Казалось, цель притягивает мигающие зеленые точки, как магнит — железные опилки. Райли ждал перехвата.

Взрыв эхом разнесся над океаном. Все точки немедленно пропали с экрана радара. Что бы ни летело к кораблю «Миссури», теперь оно бессильно упало в море всего в семистах ярдах от американского линкора. Несколько секунд спустя капитан «Глостера» вошел в радиолокационную рубку. «Чья птичка?» — спросил он Райли, желая знать, кто отдал приказ уничтожить так до сих пор и не опознанную цель. «Наша, сэр», — ответил Райли. На вопрос капитана, откуда он знал, что стреляет по иракской ракете, а не по американскому самолету, Райли ответил: «Просто знал».

Следующие четыре часа были самыми долгими в жизни Райли. Если он сбил А-6, то на его совести смерть двух ни в чем не повинных пилотов. Его карьере конец. Возможно, ему даже придется предстать перед трибуналом. Райли сразу же начал просматривать записи с радара в поисках малейшего подтверждения того, что точка на самом деле была иракской ракетой. Но даже при наличии достаточного времени на анализ Райли все равно не мог точно определить, что перед ним, — записи с радара не давали неоднозначного ответа. На «Глостере» быстро воцарилось уныние. Для изучения обломков крушения, все еще плававших на поверхности океана, направили специальную исследовательскую группу. Была проведена срочная перекличка всех самолетов Коалиции, находившихся в этом районе.

Первым новость сообщили капитану «Глостера». Он подошел к койке Райли, где тот тщетно пытался заснуть. Результаты расследования показали: точка на радаре в самом деле была ракетой «Шелкопряд», а не американским истребителем. Райли в одиночку спас линкор.

Конечно, Райли могло просто повезти. После окончания войны британские морские офицеры внимательно изучили последовательность событий, предшествовавших решению Райли выпустить ракеты Sea Dart. Они пришли к выводу, что, основываясь на записях с радара, отличить «Шелкопряд» от А-6 было невозможно. Хотя Райли принял верное решение, он так же легко мог сбить американский истребитель. Рискованная игра с лихвой окупилась, но не стала от этого менее рискованной.

Во всяком случае, так звучала официальная версия произошедшего вплоть до лета 1993 года, когда за расследование этого дела взялся Гэри Кляйн. Кляйн был когнитивным психологом, консультантом американской морской пехоты, и ему сообщили, что никто не мог объяснить, каким образом в точке на радаре удалось распознать вражескую ракету. Даже сам Райли не знал, почему в то раннее утро решил, что эта точка так опасна. Как и все остальные, он предположил, что ему просто повезло.

Кляйн был заинтригован. До этого он провел несколько десятилетий, изучая процесс принятия решений в напряженных ситуациях, и знал, что интуиция иногда может быть поразительно прозорливой, даже если причины этой прозорливости не ясны. Он решил определить источник той тревоги, которую испытывал Райли, для того чтобы понять, почему именно эта точка показалось ему такой подозрительной. С этой целью он снова вернулся к записям с радара.

Вскоре он понял, что во время возвращения А-6 с боевых вылетов Райли привык видеть на экране радара вполне конкретный рисунок из точек. Так как морской радар фиксирует сигналы только только над водой — после того как объект, так сказать, «промочил ноги», — Райли привык видеть истребители сразу после того, как они покидали кувейтский берег. Самолеты обычно становились видимыми после первого оборота радара.

Кляйн изучил записи, сделанные радаром во время предрассветной ракетной атаки. Он снова и снова отсматривал эти роковые сорок секунд, выискивая хоть какие-нибудь различия между тем, как для Райли выглядели самолеты А-6, возвращающиеся с боевых заданий, и тем, что он увидел при появлении на экране точки, скрывавшей ракету «Шелкопряд».

И тогда Кляйн увидел различие. Оно было тонким, но очень четким. Наконец он мог объяснить интуитивную догадку Райли.

Все дело было во времени. В отличие от А-6 ракета «Шелкопряд» появилась возле берега не сразу. Поскольку она летела очень низко, почти на две тысячи футов ниже, чем обычно летают А-6, ее сигнал поначалу забивали помехи с земли. В результате ракету не было видно до третьего поворота радара, то есть на восемь секунд дольше, чем не было бы видно А-6. Райли подсознательно, не отдавая себе в этом отчета, оценивал высоту точки.

Вот почему при виде иракской ракеты, появившейся на экране радара, у Райли начался легкий озноб. С этой точкой что-то было ладно. Чувствовалось, что это не А-6. И хотя Райли не мог объяснить что, он знал: происходит что-то страшное. Эту точку нужно было сбить.

1

Тем не менее открытым остается еще один вопрос: как эмоции Райли сумели найти различия между двумя идентичными на первый взгляд точками на экране радара? Что происходило в его мозгу, когда он первый раз увидел ракету «Шелкопряд», находившуюся в трех поворотах радара от побережья Кувейта? Откуда возник его страх? Ответ заключается в одной-единственной молекуле под названием дофамин, которую клетки мозга используют для связи друг с другом. Когда Райли смотрел на экран радара, вероятнее всего, именно дофаминовые нейроны подсказали ему, что перед ним ракета, а не самолет А-6.

Значение дофамина было открыто случайно. В 1954 году два нейробиолога из университета Макгилла Джеймс Олд и Питер Милнер решили вживить электрод в самый центр мозга крысы. Точное расположение электрода в значительной степени зависело от счастливой случайности: в то время география мозга оставалась тайной. Но Олдсу и Милнеру повезло. Они ввели иглу прямо рядом с прилежащим ядром — частью мозга, которая вырабатывает приятные эмоции. Когда вы едите кусок шоколадного торта, слушаете любимую песню или смотрите, как ваша любимая команда выигрывает первенство по бейсболу, своим счастьем вы обязаны именно прилежащему ядру.

Но Олдс и Милнер довольно быстро обнаружили, что слишком сильное удовольствие может быть фатальным. Они поместили электроды в мозг нескольких грызунов, а затем пустили по каждому проводу слабый ток, приведя таким образом прилежащее ядро в состояние постоянного возбуждения. Ученые заметили, что грызуны утратили интерес ко всему. Они перестали есть и пить, утратили интерес к сексуальному поведению. Крысы просто съеживались в углах своих клеток, замерев от счастья. За несколько дней все животные погибли. Они умерли от жажды.

Потребовались десятилетия кропотливых исследований, но в результате нейробиологи узнали, что крысы пострадали от избытка дофамина. Стимуляция прилежащего ядра вызывала большой выплеск нейротрансмиттера, из-за чего крысы впадали в экстаз. На людей похожим образом действуют наркотики: подсевший на крэк наркоман, только что принявший дозу, ничем не отличается от пребывающей в электрической неге крысы. Мозг обоих существ ослеплен удовольствием. Эта фраза вскоре стала своеобразным допаминовым клише — химическим объяснением секса, наркотиков и рок-н-ролла.

Но счастье — не единственное чувство, вызываемое дофамином. Сейчас ученым известно, что этот нейротрансмиттер помогает регулировать все наши эмоции — от только зарождающейся любви до самых тяжелых форм отвращения. Это наиболее ходовая нервная валюта нашего мозга — молекула, которая помогает нам выбрать один из вариантов. Увидев, как дофамин работает в мозгу, мы сможем выяснить, почему чувства способны даровать нам столь глубокие прозрения. Хотя Платон пренебрежительно отзывался об эмоциях как об иррациональных и ненадежных — «дикая лошадь души», — в действительности они отображают огромный объем невидимого глазу анализа.

В наибольшей мере наше понимание дофаминовой системы основывается на результатах новаторских исследований Вольфрама Шульца, нейробиолога из Кембриджского университета. Он любит сравнивать дофаминовые нейроны (те нейроны, которые используют дофамин для коммуникации) с фоторецепторами на сетчатке, фиксирующими проникающие в глаз лучи света. Так же как процесс зрения начинается с сетчатки, процесс принятия решений начинается с колебаний дофамина.

В начале 1970-х, еще будучи студентом-медиком, Шульц заинтересовался этим нейротрансмиттером из-за роли, которую он играет в возникновении симптомов паралича при болезни Паркинсона. Он изучал клетки в мозгу обезьяны, надеясь понять, какие из них участвуют в контроле за движениями тела. Но он не смог ничего обнаружить. «Это был классический случай неудачного эксперимента, — говорит он. — Как ученый я был глубоко разочарован». Однако после многолетних исследований Шульц заметил кое-что странное в этих дофаминовых нейронах: они начинали возбуждаться прямо перед тем, как обезьяне давали награду — к примеру, кусочек банана. (Награды использовались для того, чтобы заставить обезьян двигаться.) «Сначала мне показалось маловероятным, чтобы одна клетка могла отражать такой сложный объект, как еда, — рассказывает Шульц. — Вроде бы для одного нейрона это слишком много информации».

После нескольких сотен экспериментов Шульц начал верить полученным данным: он понял, что случайно обнаружил в мозгу примата механизм поощрения в действии. В середине 1980 годов после публикации ряда знаменательных статей Шульц решил разобраться в этой схеме. Как именно одной клетке удавалось отражать поощрение? И почему она возбуждалась до того, как награда была дана?

Эксперименты Шульца были довольно простыми: он проигрывал громкой звук, ждал пару секунд, после чего вливал в рот обезьяне несколько капель яблочного сока. В ходе эксперимента Шульц исследовал мозг обезьяны с помощью иглы, измерявшей электрическую активность внутри отдельных клеток. Сначала дофаминовые нейроны возбуждались только в тот момент, когда в рот обезьяны попадал сок. Клетки реагировали на саму награду. Однако, как только животное поняло, что звук предшествует появлению сока — для этого потребовалось всего несколько попыток, — те же нейроны начали возбуждаться при появлении звука, а не самого сладкого приза. Шульц назвал эти клетки «предсказывающими нейронами», потому что их больше заботило предсказание появления награды, а не само ее получение. (Эту цепочку можно бесконечно удлинять: например, сделать так, что дофаминовые нейроны будут реагировать на свет, который предшествует звуку, который предшествует соку, и т. д.). Как только эта простая схема была освоена, дофаминовые нейроны обезьяны становились очень чувствительны к малейшим вариациям в ней. Если предсказания клеток оказывались верными и награда появлялась вовремя, у примата происходил краткосрочный выплеск дофамина, возникало чувство удовольствия от того, что он был прав. Однако если схема нарушалась — если звук проигрывался, но сок не поступал, — дофаминовые нейроны обезьяны снижали свою активность. Это явление называется сигналом ошибки предсказания. Обезьяна расстраивалась из-за того, что ее предсказания о соке не реализовались.

В этой системе интерес представляет все, связанное с ожиданиями. Дофаминовые нейроны постоянно порождают схемы, основанные на нашем опыте: если А, то В. Они выучивают, что звук предвещает появление сока или что свет предвещает появление звука, который предвещает появление сока. Хаос реальности превращается в модели взаимозависимостей, позволяющих мозгу предвидеть то, что произойдет дальше. В результате обезьяны быстро усваивают, когда ожидать сладкой награды.

После того как механизм клеточных прогнозов оптимизирован, мозг начинает сравнивать предсказания с тем, что происходит на самом деле. С той минуты, как обезьяна привыкает ожидать сока после определенной последовательности событий, ее дофаминовые клетки внимательно следят за развитием ситуации. Если все идет по плану, дофаминовые нейроны обеспечивают короткую вспышку удовольствия. Обезьяна счастлива. Но если ожидания не оправдались — если обезьяна не получает обещанного сока, — дофаминовые клетки объявляют забастовку. Они немедленно посылают сигнал, сообщающий об их ошибке, и перестают выделять дофамин.

Мозг устроен таким образом, чтобы усиливать шок от этих ошибочных предсказаний. Когда он сталкивается с чем-то неожиданным — например, с точкой на радаре, не вписывающейся в привычную схему, или каплей сока, которая не появляется вовремя, — кора мозга сразу обращает на это внимание. За несколько миллисекунд мозговые клетки поглощены сильной эмоцией. Ничто не может заставить мозг сосредоточиться так, как удивление.

Этот быстрый клеточный процесс начинается в крошечной области в самом центре мозга, богатой дофаминовыми нейронами. Нейробиологам уже несколько лет известно, что этот участок, передняя поясничная кора (ППК), задействован в определении ошибок. Когда дофаминовые нейроны делают ошибочное предсказание — когда они ожидают сока, но не получают его, — мозг порождает особый электрический сигнал, известный как негативность, связанная с ошибкой. Этот сигнал исходит из ППК, так что многие нейробиологи называют это место областью «О черт!».

Значимость ППК предопределена самим устройством мозга. Подобно орбитофронтальной коре ППК помогает обеспечивать связь между тем, что мы знаем, и тем, что чувствуем. Она расположена в точке пересечения двух разных способов мышления. С одной стороны, ППК тесно связана с таламусом — областью мозга, которая отвечает за направленное осознанное внимание. Это значит, что если ППК встревожена каким-то фактором — например, неожиданным ружейным выстрелом, — она может сразу же сосредоточиться на соответствующих ощущениях. Она заставляет человека фиксировать неожиданные события.

Подавая сигнал тревоги сознанию, ППК одновременно посылает импульс в гипоталамус, регулирующий важные аспекты физических функций. Когда ППК обеспокоена какой-то аномалией — например, неправильной точкой на экране радара, — ее беспокойство немедленно переводится в соматический сигнал и мышцы готовятся к действию. За несколько секунд частота сердцебиения увеличивается и в кровь вбрасывается адреналин. Эти физические ощущения заставляют нас реагировать на ситуацию немедленно. Посредством учащенного пульса и влажных ладоней мозг сообщает нам, что медлить нельзя. С этой ошибкой предсказания нужно разбираться немедленно.

Но ППК не только следит за ошибочными предсказаниями. Она также помогает запоминать, чему дофаминовые клетки только что обучились, чтобы быстро адаптировать ожидания к новым условиям. Она усваивает уроки реальной жизни, следя за оперативным обновлением нейронных цепочек. Если, согласно предсказанию, сок должен был появиться после звука, но этого так и не произошло, ППК проследит за тем, чтобы в будущие предсказания были внесены соответствующие коррективы. Краткосрочное ощущение преобразуется в долгосрочный урок. Даже если обезьяна не знает, что именно запомнила ППК, в следующий раз, когда она будет ждать струи сока, ее мозговые клетки окажутся наготове. Они точно знают, когда появится приз.

Это ключевой аспект принятия решений. Если мы не сможем использовать прошлые уроки для будущих решений, нам придется бесконечно повторять собственные ошибки. Если хирургическим образом удалить ППК из мозга обезьяны, поведение примата станет сумасбродным и неэффективным. Обезьяны больше не смогут предсказывать появление награды или разбираться в окружающем мире. Исследователи из Оксфорда провели изящный эксперимент, выявивший это нарушение. Обезьяна держала джойстик, который двигался в двух направлениях: либо снизу вверх, либо вокруг своей оси. В каждый конкретный момент только одно из этих движений приводило к получению награды (кусочка еды). Чтобы сделать эксперимент еще интереснее, ученые изменяли направление, за которое полагалась награда, через каждые двадцать пять попыток. Обезьяне, привыкшей поднимать джойстик для получения награды, теперь нужно было изменить свою стратегию.

Что же делали обезьяны? У животных с неповрежденной ППК это задание не вызывало никаких проблем. Как только они прекращали получать награду за поднятие джойстика, они начинали поворачивать его в другом направлении. Проблема быстро решалась, и обезьяны продолжали получать еду. Однако обезьяны с удаленной ППК демонстрировали важный поведенческий дефект. Когда их переставали награждать за перемещение джойстика в определенном направлении, они все еще могли (в большинстве случаев) изменить траекторию его движения, как нормальные обезьяны. Однако они не могли продолжать пользоваться этой успешной стратегией и скоро начинали двигать джойстик в том направлении, которое не приносило им награды. Они были не в состоянии понять, как постоянно получать еду и как извлечь из ошибки долгосрочный урок. Так как эти обезьяны не имели возможности усовершенствовать свои клеточные предсказания, простой эксперимент приводил их в состояние безнадежного замешательства.

Люди с генетической мутацией, приведшей к сокращению числа дофаминовых рецепторов в ППК, страдают от схожей проблемы: совсем как обезьяны, они по большей части не способны учиться на негативном опыте. Этот, казалось бы, мелкий недостаток имеет большие последствия. К примеру, согласно исследованиям, люди с такой мутацией имеют гораздо больше шансов попасть в зависимость от наркотиков и алкоголя. Так как им сложно учиться на своих ошибках, они совершают одни и те же ошибки снова и снова. Они не могут изменить свое поведение, даже если оно вредит им самим.

У ППК имеется и еще одна важная особенность, которая в полной мере проясняет ее значение: в ней содержится много клеток очень редкого типа, известных как веретенообразные нейроны. В отличие от остальных клеток нашего мозга, обычно являющихся короткими и кустистыми, эти мозговые клетки длинные и тонкие. Они есть только у людей и человекообразных приматов, и это позволяет предположить, что их эволюция была связана с более высоким уровнем познания. У людей примерно в сорок раз больше веретенообразных клеток, чем у любых других приматов.

Странная форма веретенообразных клеток обусловлена их уникальной функцией: их антенноподобные тела могут передавать эмоции через весь мозг. После того как ППК получает информацию от дофаминовых нейронов, веретенообразные клетки используют свою скорость — они передают электрические сигналы быстрее любых других нейронов — для того, чтобы вся остальная кора головного мозга оказалась сразу же пронизана этим особым чувством. В результате незначительные колебания одного вида нейротрансмитеров играют большую роль в управлении нашими действиями, подсказывая, какие чувства в нас должно пробудить увиденное.

«Скорее всего, в 99,9 % случаев вы даже не подозреваете о выбросе дофамина, — говорит Рид Монтагью, профессор нейробиологии в университете Бейлор. — Но при этом в 99,9 % случаев вы руководствуетесь информацией и эмоциями, которые он передает в другие части мозга».

Теперь мы можем приблизиться к пониманию удивительной мудрости наших эмоций. Активность наших дофаминовых нейронов показывает, что чувства не являются просто отражениями жестко прописанных животных инстинктов. Эти дикие лошади вовсе не своевольны. Напротив, корни человеческих эмоций кроются в предсказаниях очень легко адаптирующихся клеток мозга, которые постоянно меняют свои настройки для того, чтобы лучше отражать реальность. Каждый раз, когда вы совершаете ошибку или сталкиваетесь с чем-то новым, ваши мозговые клетки начинают меняться. Наши эмоции крайне эмпиричны.

Рассмотрим, к примеру, эксперимент Шульца. Когда он изучал своих жаждущих сока обезьян, он обнаружил, что всего лишь после нескольких экспериментальных попыток нейроны обезьян прочно усвоили, когда ожидать награды. Нейроны достигли этого, непрерывно анализируя новую информацию и превращая негативное чувство в полезный урок. Если сок не поступал, дофаминовые клетки адаптировали свои прогнозы. Обманешь меня единожды — стыд тебе и позор. Обманешь меня дважды — стыд и позор моим дофаминовым нейронам.

Тот же процесс постоянно происходит в мозгу человека. Укачивание в транспорте в значительной степени является результатом ошибочных дофаминовых предсказаний: возникает конфликт между типом происходящего движения — например, непривычный наклон лодки — и типом ожидаемого движения (твердая, неподвижная земля). В этом случае результатом могут стать тошнота и рвота. Но спустя немного времени дофаминовые нейроны начинают исправлять свои модели движения, именно поэтому морская болезнь обычно бывает временной. После нескольких ужасных часов дофаминовые нейроны корректируют свои предсказания и обучаются ожидать легкого покачивания морской волны.

Полное разрушение дофаминовой системы — при котором нейроны не способны исправлять свои ожидания с учетом реальности — может привести к психическому заболеванию. Корни шизофрении пока что остаются тайной, но одна из причин, видимо, состоит в избытке определенных типов дофаминовых рецепторов. Это делает дофаминовую систему гиперактивной и неконтролируемой, так что нейроны шизофреника не могут делать убедительные предсказания или соотносить свое возбуждение с событиями в окружающем мире. (Большинство нейролептических препаратов уменьшают активность дофаминовых нейронов.) Так как шизофреники не могут распознавать реально существующие схемы, они начинают воображать неверные. Поэтому шизофреники часто становятся параноиками и оказываются подвержены совершенно непредсказуемым перепадам настроения. Их эмоции утрачивают связь с событиями в реальном мире.

Деструктивные симптомы шизофрении помогают осознать необходимость и точность дофаминовых нейронов. Когда эти нейроны работают должным образом, они служат ключевым источником мудрости. Эмоциональный мозг без труда понимает, что происходит и как извлечь из ситуации максимальную выгоду. Каждый раз, когда вы испытываете радость или разочарование, страх или счастье, ваши нейроны занимаются перестройкой своей цепи, анализируя, какие сенсорные сигналы предшествовали эмоциям. Этот урок затем помещается в память, так что в следующий раз, когда вам придется принимать решение, ваши мозговые клетки будут наготове. Они уже научились предсказывать, что же произойдет дальше.

2

Нарды — старейшая игра в мире. Впервые в нее начали играть в древней Месопотамии, около 3000 лет до нашей эры. Она была популярным развлечением в Древнем Риме, ее воспевали персы и запрещал французский король Людовик IX как побуждающую к незаконным азартным играм. В семнадцатом веке царедворцы Елизаветы I систематизировали правила игры, и с тех пор нарды мало изменились.

Однако того же нельзя сказать об игроках. Одним из лучших игроков в нарды в мире сейчас является компьютерная программа. В начале 1990-х годов Джеральд Тезауро, программист из компании IBM, начал разрабатывать новый вид искусственного интеллекта (ИИ). В то время большинство программ ИИ основывались на примитивных вычислительных возможностях микросхем. Этот подход был использован в Deep Blue, мощном суперкомпьютере IBM, сумевшем в 1997 году побить шахматного гроссмейстера Гарри Каспарова. Deep Blue мог анализировать более двухсот миллионов возможных шахматных ходов в секунду и, таким образом, имел возможность постоянно выбирать оптимальную шахматную стратегию. (Мозг Каспарова, напротив, мог просчитывать лишь около пяти ходов в секунду.) Но вся эта стратегическая огневая мощь требовала большого количества энергии: во время шахматного матча Deep Blue был пожароопасен и требовал специального охлаждающего оборудования, чтобы не загореться. Между тем Каспаров даже практически не вспотел. Дело в том, что человеческий мозг — прекрасный образец производительности: даже когда он погружен в глубочайшие раздумья, кора головного мозга потребляет меньше энергии, чем электрическая лампочка.

В то время как массовая пресса превозносила потрясающее достижение Deep Blue — машина переиграла самого великого шахматиста в мире, — Тезауро был озадачен ограниченностью ее возможностей. Машина, способная думать в миллионы раз быстрее, чем ее человеческий противник, с трудом выиграла матч. Тезауро понял, что проблемой всех стандартных программ ИИ, даже таких блестящих, как у компьютера Deep Blue, является негибкость. Большая часть интеллекта Deep Blue была заимствована у других шахматных гроссмейстеров, чья мудрость была оцифрована и заложена в его программу. (Программисты из IBM также изучили предыдущие шахматные матчи Каспарова и настроили программу на использование его повторяющихся стратегических ошибок.) Но сама машина не могла учиться. Вместо этого она принимала решения, предсказывая вероятные последствия нескольких миллионов различных шахматных ходов. Ход с максимальной предсказанной «ценностью» был тем, который компьютер в результате и совершал. Для Deep Blue игра в шахматы была просто бесконечной серией математических задач.

Конечно, такой вид искусственного интеллекта не является точной моделью человеческого сознания. Каспаров смог соревноваться на том же уровне, что и Deep Blue, хотя его мозг обладал гораздо меньшей вычислительной мощностью. Удивительная догадка Тезауро состояла в том, что нейроны Каспарова были так эффективны потому, что они сами себя натренировали. Их усовершенствовал многолетний опыт выявления едва различимых пространственных шаблонов на шахматной доске. В отличие от Deep Blue, анализировавшего каждый возможный ход, Каспаров мог сразу взвесить возможные стратегические варианты и сосредоточить свои умственные силы на оценке только самых перспективных из них.

Тезауро решил создать программу ИИ, которая бы действовала как Гарри Каспаров. Для своей модели он выбрал нарды (backgammon) и назвал программу TD-Gammon. (TD, temporal difference, означает «временное различие»). Deep Blue был изначально запрограммирован на игру в шахматы, а программа Тезауро начинала с чистого листа. Сначала ее ходы были совершенно случайными. Она проигрывала каждый матч и делала глупые ошибки. Но компьютер недолго оставался новичком — TD-Gammon был запрограммирован так, чтобы учиться на собственном опыте. Днем и ночью он играл в нарды сам с собой, терпеливо выясняя, какие ходы наиболее эффективны. После сотен тысяч партий TD-Gammon мог выиграть у лучших человеческих игроков в мире.

Как машина превратилась в эксперта? Хотя математические подробности программы Тезауро утомительно сложны, базовый подход крайне прост[13]. TD-Gammon порождал набор предсказаний о том, как будет развиваться игра в нарды. В отличие от Deep Blue, это компьютерная программа не исследовала каждое возможное перемещение. Вместо этого она действовала как Гарри Каспаров и порождала предсказания, основываясь на своем прошлом опыте. Программное обеспечение сравнивало эти предсказания с реальным ходом игры. Выявленные несоответствия становились материалом для обучения, и программа стремилась постоянно сокращать «ложный сигнал». В результате точность предсказаний постоянно росла, и, следовательно, стратегические решения программы становились все более эффективными и разумными.

В последние годы та же стратегия использовалась для решения всевозможных сложных задач от программирования работы групп лифтов в небоскребах до составления расписания полетов. «Эти самообучающиеся программы доказали свою полезность для решения любых задач с, казалось бы, бесконечным количеством возможностей, — говорит Рид Монтагью. — Ведь лифты и самолеты можно распределить в самых разных последовательностях». Самое главное различие между программами обучения с подкреплением и традиционными подходами состоит в том, что эти новые программы сами находят оптимальные решения. Никто не говорит компьютеру, как организовать работу лифтов. Вместо этого он систематически обучается методом проб и ошибок, пока после определенного числа проб лифты не начинают ездить с максимально возможной эффективностью. Ошибки, казавшиеся неизбежными, успешно устранены.

Этот метод программирования довольно точно отражает действие дофаминовых нейронов. Клетки мозга тоже измеряют несоответствие ожидания конечному результату. Они используют свои неизбежные ошибки для повышения производительности, в конечном счете обращая неудачу в успех. Рассмотрим, к примеру, эксперимент, известный как «айовский игровой тест». Он был разработан нейробиологами Антонио Дамасио и Антуаном Бекара. Игра проводилась следующим образом: человеку — «игроку» — выдавалось четыре колоды карт, две черных и две красных, и 2000 долларов на игру. Каждая карта сообщала игроку, выиграл он деньги или проиграл. Общая рекомендация состояла в том, чтобы переворачивать карты из одной из четырех колод и выиграть как можно больше денег.

Но карты были распределены по колодам не случайным образом. Ученые их подтасовали. Две колоды состояли из крайне рискованных карт. Выигрыши там были больше (100 долларов), но штрафы в них тоже были непомерные (1250 долларов). Две другие колоды были сравнительно сбалансированными и умеренными. Хотя выигрыши в них были меньше (50 долларов), они реже штрафовали игрока. Если бы игрок тянул только из этих колод, он бы в результате оказался в неплохом выигрыше.

Сначала процесс выбора оставался совершенно случайным. Не было никакой причины отдавать предпочтение ка-кой-то конкретной колоде, так что большинство людей пробовало брать из каждой стопки, ища наиболее прибыльные карты. В среднем людям требовалось перевернуть около пятидесяти карт для того, чтобы начать тянуть исключительно из прибыльных стопок. И в среднем около восьмидесяти карт уходило на то, чтобы проходивший эксперимент человек смог объяснить, почему он или она отдают предпочтение этим колодам. Логика медлительна.

Но Дамасио интересовала не логика, а эмоции. Все время игры участники эксперимента были подсоединены к компьютеру, который измерял электрическую проводимость их кожи. Обычно более высокие уровни проводимости свидетельствуют о нервозности и беспокойстве. Ученые выяснили, что уже после десятка карт рука игрока становилась более «нервной», когда тянулась к опасной колоде. Хотя сам игрок все еще не очень понимал, какие стопки наиболее прибыльны, его эмоции сформировали вполне определенное чувство страха. Эмоции знали, какие колоды таили в себе риск. Чувства человека разгадали игру первыми.

Пациенты с неврологическими расстройствами, которые не могли испытывать вообще никаких эмоций — обычно из-за повреждений орбитофронтальной коры, — оказались не способны выбирать правильные карты. В то время как большинство выиграло во время эксперимента значительные суммы, эти исключительно рациональные люди часто становились банкротами и вынуждены были брать «ссуды» у проводящего эксперимент. Так как эти пациенты не могли проассоциировать плохие колоды с негативными чувствами — их ладони не проявляли никаких признаков нервозности, — они продолжали брать равное число карт из всех четырех колод. Пока мозг не получит эмоционального укола от проигрыша, он никогда не поймет, как выигрывать.

Как наши эмоции становятся такими безошибочными? Как им удается так быстро научиться определять прибыльные колоды? Ответ возвращает нас к дофамину, молекулярному источнику наших чувств. Проводя айовский тест у человека, которому для лечения эпилепсии делали операцию на головном мозге (пациенту ввели местную анестезию, но он оставался в сознании), ученые из Университета Айовы и Калифорнийского технологического института смогли пронаблюдать за тем, как процесс обучения проходит в реальном времени. Ученые обнаружили, что клетки мозга человека программируются так же, как и TD-Gammon они формируют предсказания того, что произойдет, и определяют различия между своими ожиданиями и реальными результатами. В ходе айовского игрового эксперимента, если клеточное предсказание было неверным — например, если игрок выбирал плохую колоду, — дофаминовые нейроны немедленно прекращали возбуждаться. Игрок испытывал неприятное чувство и учился больше не брать из этой колоды (разочарование поучительно). Однако если предсказание было точным — если он вознаграждался за выбор прибыльной карты, — тогда игрок испытывал удовольствие от того, что был прав, и эта конкретная связь оказывалась подкреплена. В результате его нейроны быстро обучились зарабатывать деньги. Они раскрыли секрет выигрыша в этой игре еще до того, как игрок смог понять и объяснить собственное решение.

В этом и состоит ключевой когнитивный талант. Дофаминовые нейроны автоматически определяют едва различимые схемы, которые мы иначе заметить не сможем, они усваивают всю информацию, которую мы не можем осмыслить на сознательном уровне. А затем, составив набор усовершенствованных прогнозов предстоящих событий, они переводят эти предсказания в эмоции. Представьте, к примеру, что вы получили много информации о том, как двадцать различных акций вели себя за некоторый период времени. (Разные курсы акций показывают бегущей строкой внизу телеэкрана, например, на канале CNBC.) Очень скоро вы обнаружите, что вам сложно вспомнить всю финансовую информацию. Если вас спросят, какие акции показали наилучшие результаты, вы, скорее всего, не сможете дать точный ответ. Вы не можете обработать всю информацию. Однако если вас спросят, какие акции вызывают у вас наилучшие чувства, — теперь вопрос задают вашему эмоциональному мозгу, — вы неожиданно для себя сможете определить лучшие акции. Согласно Тилману Бетчу, психологу, который провел этот изящный эксперимент, эмоции «обнаруживают потрясающий уровень чувствительности» к реальному поведению различных ценных бумаг. Акции, которые поднялись в цене, будут ассоциироваться у вас с наиболее позитивными эмоциями, тогда как бумаги, стоимость которых упала, вызовут смутное беспокойство. Эти мудрые, хотя и необъяснимые чувства являются важнейшей составляющей процесса принятия решений. Даже когда нам кажется, что мы ничего не знаем, нашему мозгу что-то известно. Именно об этом нам и пытаются сказать наши чувства.

3

Это не означает, что можно бездумно полагаться на эти клеточные эмоции. Дофаминовые нейроны должны все время учиться и переучиваться, иначе точность их предсказаний будет снижаться. Чтобы иметь возможность доверять своим эмоциям, мы должны постоянно проявлять бдительность, ведь разумная интуиция является результатом сознательных упражнений. Сказанное Сервантесом о пословицах — «Эти короткие фразы порождены долгим опытом» — также применимо и к клеткам мозга, но только если мы их ими правильно пользуемся.

Возьмем, к примеру, Билла Роберти. Он один из немногих людей в мире, которым удалось стать экспертами мирового класса сразу в трех различных играх (для сравнения представьте себе, что, скажем, Бо Джексон начал бы выступать одновременно в Национальной баскетбольной, Национальной футбольной и высшей бейсбольной лигах…). Роберти — гроссмейстер и бывший чемпион США по быстрым шахматам. Он очень уважаемый эксперт по покеру и автор нескольких популярных книг по Техасскому холдему. Однако наибольшую известность Роберти получил благодаря игре в нарды. Он дважды выигрывал мировой чемпионат по нардам (кроме него это удалось всего одному человеку) и регулярно попадает в топ-10 игроков в мире. В начале 1990-х годов, когда Джеральд Тезауро искал эксперта в этой игре для состязания с TD-Gammon, он выбрал Роберти. «Он хотел, чтобы его компьютер учился у лучшего, — говорит Роберти, — а я и был лучшим».

Сейчас Роберти немного за шестьдесят, у него копна седеющих волос, глаза с тяжелыми веками и очки с толстыми стеклами. Он смог превратить свое детское увлечение шахматами в прибыльную работу. Когда Роберти говорит об играх, в его голосе все еще звучит мальчишеский энтузиазм человека, который до конца не верит в то, что может зарабатывать себе на жизнь, играя. «В первый раз, когда я играл против TD-Gammon, я был под сильным впечатлением, — говорит он. — Он заметно превосходил все остальные компьютерные программы, с которыми я сталкивался. Но я чувствовал, что все равно играю лучше. Однако на следующий год все изменилось. Теперь компьютер стал грозным противником. Он научился играть, играя со мной».

Компьютерная программа достигла мастерства в нардах, изучив собственные ошибки в предсказаниях. Совершив несколько миллионов ошибок, TD-Gammon сравнялся с Deep Blue, способным бросить вызов лучшим противникам среди людей. Однако все эти потрясающие машины имеют одно строгое ограничение: каждый может овладеть лишь одной игрой. TD-Gammon не может играть в шахматы, a Deep Blue — в нарды. И пока ни один компьютер не смог добиться совершенства в покере.

Как же Роберти удалось так хорошо освоить настолько разные игры? На первый взгляд кажется, что шахматы, нарды и покер опираются на совершенно разные когнитивные навыки. Именно поэтому большинство чемпионов по нардам обычно играют только в эту игру, большинство гроссмейстеров не интересуются карточными играми, а большинство игроков в покер не могут отличить латвийский гамбит от французской защиты. И тем не менее Роберти смог преуспеть во всех трех областях. По его словам, его успех объясняется просто. «Я умею учиться, — говорит он. — Я знаю, как сделать себя лучше».

В начале 1970-х годов, когда Роберти был всего лишь шахматным вундеркиндом и зарабатывал на жизнь, выигрывая чемпионаты по быстрым шахматам, он познакомился с нардами. «Я сразу же влюбился в эту игру, — вспоминает он. — Кроме того, на ней можно было заработать больше, чем на быстрых шахматах». Роберти купил книгу по стратегии игры в нарды, запомнил несколько начальных ходов и начал играть. А потом снова играть. И снова. «Нужно стать одержимым, — говорит он. — Необходимо достичь такого состояния, когда игра начинает тебе сниться».