Эмоциональный компьютер
Эмоциональный компьютер
Начнем издалека. Представим себе, что ученые девятнадцатого века неким волшебным образом получили современный компьютер. Они стали бы изучать его работу, создали бы целую науку, описывающую свойства операционной системы и установленных программ. Затем они вскрыли бы этот компьютер и попытались описать его основные узлы, понять их назначение. Потом они стали бы измерять напряжение в различных точках. Возникли бы многообразные теории о циркулирующих внутри компьютера потоках информации. Но самое главное, что сложность устройства современного компьютера затруднила бы ученым путь к пониманию достаточно простых принципов, лежащих в основе любой вычислительной техники. Эти принципы были сформулированы в «машине Тьюринга» и не изменились по сей день, и неважно собран ли компьютер на лампах, транзисторах или микросхемах. Любой компьютер имеет память, систему команд, процессор, который умеет эти команды выполнять, программы, состоящие из последовательности команд и устройства ввода—вывода, позволяющие взаимодействовать с внешним миром. Остальное «навороты», возникшие в результате эволюции вычислительной техники, хотя и многократно увеличивают возможности компьютера, не отменяют эти принципы.
Машина Тьюринга (МТ) — абстрактный исполнитель (абстрактная вычислительная машина). Была предложена Аланом Тьюрингом в 1936 году для формализации понятия алгоритма.
Машина Тьюринга является расширением конечного автомата и, согласно тезису Чёрча — Тьюринга, способна имитировать все другие исполнители (с помощью задания правил перехода), каким-либо образом реализующие процесс пошагового вычисления, в котором каждый шаг вычисления достаточно элементарен.
В состав машины Тьюринга входит бесконечная в обе стороны лента (возможны машины Тьюринга, которые имеют несколько бесконечных лент), разделенная на ячейки, и управляющее устройство, способное находиться в одном из множества состояний. Число возможных состояний управляющего устройства конечно и точно задано.
Управляющее устройство может перемещаться влево и вправо по ленте, читать и записывать в ячейки ленты символы некоторого конечного алфавита. Выделяется особый пустой символ, заполняющий все клетки ленты, кроме тех из них (конечного числа), на которых записаны входные данные.
Управляющее устройство работает согласно правилам перехода, которые представляют алгоритм, реализуемый данной машиной Тьюринга. Каждое правило перехода предписывает машине, в зависимости от текущего состояния и наблюдаемого в текущей клетке символа, записать в эту клетку новый символ, перейти в новое состояние и переместиться на одну клетку влево или вправо. Некоторые состояния машины Тьюринга могут быть помечены как терминальные, и переход в любое из них означает конец работы, остановку алгоритма.
Изучение человеческого мозга во многом напоминает нарисованную картину. Мы знаем многое о его внутренней структуре, глубоко изучены процессы, протекающие в нейронах, но для многих исследователей обилие разнообразных знаний, заслоняет понимание достаточно простых принципов лежащих в основе работы мозга.
Зададимся целью создать «мозг» простого устройства, который будет в своем существовании использовать те же принципы, которые присущи живым существам. Конечно, реальный мозг устроен значительно сложнее, но сейчас я попытаюсь сформулировать основной принцип, настолько же фундаментальный для понимания работы мозга, насколько понимание «машины Тьюринга» основополагающе для понимания работы современного компьютера.
Возможно, не всем читателям хватит терпения разобраться в последующем описании нейронной конструкции. Однако очень важно ухватить основную идею, так как она тем или иным образом затрагивает все, что будет изложено в этой книге далее. Поэтому сформулирую ее сразу, до начала описания устройства.
Изначально все поступки — следствия рефлексов. Эмоции не «толкают» нас на какое-либо поведение. Эмоции «дают оценку» всему, что происходит. Всегда присутствует итоговая скалярная оценка по шкале «хорошо/плохо». Итоговая оценка фиксируется памятью вместе с «ситуацией», которая вызвала эту оценку. «Ситуации» содержат в себе не только внешнюю картину мира, но и нашу реакцию на нее, наши поступки. Память впоследствии, реагируя на внешнее воздействие, «заставляет» совершать какие-либо действия или «препятствует» им. Причем действия, которые мы совершаем исходя из нашего опыта, с наибольшей вероятностью, в сравнении с другими возможными действиями, будут вести к положительному изменению эмоционального состояния. Эмоции, которые сопровождают наши поступки, нельзя трактовать как «побудители действия», это — оценки происходящего, которые нужны для формирования опыта.
Рисунок 13. Пример простейшего мозга, построенного на формальных нейронах.
Рассмотрим устройство, изображенное на рис. 13.
Каждый из кружочков обозначает некий формальный нейрон — искусственный аналог нейрона реального мозга. За исключением «регулятора», который сам является несложной конструкцией из нейронов. В устройстве используется несколько, немного различных по свойствам, типов нейронов.
Опишем их.
— «Датчики», то есть нейроны, которые получают некую информацию об окружающем мире и находятся в состоянии активности, пока присутствует то раздражение, на которое они реагируют.
— «Исполнительные нейроны» — они активируются в том случае, если сумма сигналов входов превышает некое пороговое значение. Активировавшись, исполнительные нейроны приводят в действие связанные с ними исполнительные устройства. При прекращении условия активации нейроны возвращаются в неактивное состояние и прекращают работу исполнительного устройства. Сигналы, приходящие на входы исполнительных нейронов, могут быть активирующие (+1) или тормозящие (-1). Пороговое значение можно сделать зависящим от числа активных входов.
— «Рефлексы» — нейроны, связи которых изначально определены. Эти связи образуют матрицу рефлексов. Сами нейроны активируются при возникновении строго определенной картины активности датчиков, причем сочетание активности датчиков, которое к этому приводит, задается изначально. В случае активации рефлексы дают активирующий (+1) либо тормозящий (-1) сигнал исполнительным нейронам.
— «Эмоциональные рефлексы» — нейроны, которые работают так же, как и рефлексы, с той лишь разницей, что активирующие сигналы поступают на эмоции.
— «Эмоции» — нейроны, которые активируются в случае активации замкнутых на них эмоциональных рефлексов. Совокупность активности нейронов- «эмоций» образует «эмоциональный фон», то есть то, как воспринимает и оценивает наше устройство отраженный через датчики окружающий мир. Изменение состояния датчиков может привести к изменению эмоционального фона. Каждый раз, когда происходит изменение эмоционального фона, то есть меняется состояние любого из нейронов-«эмоций», будем фиксировать на одном из нейронов памяти текущую картину активности. Отвечает за этот процесс «регулятор». Он выбирает свободный нейрон и дает ему команду на запоминание, а также сообщает, как изменилось эмоциональное состояние (+1 или -1).
Изменение эмоционального состояния будем оценивать следующим образом:
(+1) — если изменение привело к улучшению эмоционального фона, то есть возросла величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона- «эмоции»). Например, (+1) возникает, когда появляется положительная эмоция («хорошо») или прекращается отрицательная эмоция («плохо»).
(-1) — если изменение привело к ухудшению эмоционального фона, то есть уменьшилась величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона- «эмоции»). Например, (-1) возникает, когда появляется отрицательная эмоция («плохо») или прекращается положительная эмоция («хорошо»).
Если с изменением состояния обоих нейронов-«эмоций» итоговое эмоциональное состояние не изменилось, то на выбор читателя можно не запоминать такое событие или ввести принцип доминирования одной эмоции над другой.
— «Память» — нейроны, которые могут находиться в трех режимах.
Режим 1. Изначально все нейроны памяти девственно чисты и не оказывают влияния на работу системы.
Режим 2. По команде «регулятора» нейроны памяти способны фиксировать картину активности других нейронов, связанных с ними (датчиков, эмоций, исполнительных нейронов). Фиксируется состояние активности на связях и направление изменения эмоционального состояния системы — (+1) или (-1).
Режим 3. Запомнив свою картину, нейрон памяти переходит в новое состояние. В этом состоянии нейрон активируется, если «узнаёт» картину активности, которая соответствовала моменту запоминания. Чтобы не тормозить повествование, я расшифрую несколько позже понятие «узнаёт». Активировавшись в случае определенного рода «повторения» картины активности нейронов, соответствующей моменту запоминания, нейрон памяти подает сигналы по всем направлениям, которые были активны в момент запоминания. Причем если в момент запоминания изменение эмоционального состояния имело значение (+1), то сигнал подается активирующий (+1), если же значение было (1), то тормозящий (-1).
— «Регулятор» — это, скорее, не отдельный нейрон, а некий узел, который можно собрать из более простых «классических» нейронов, но сейчас не хотелось бы отвлекаться на описание его возможного устройства. Регулятор дает команды нейронам памяти на запоминание и сообщает им направление изменения эмоционального состояния.
Такое устройство, которое, кстати, несложно реализовать на практике, ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. Но, кроме рефлексов, устройство имеет возможность формировать инстинкты, то есть способность испытывать эмоции и запоминать события, приводящие к их изменениям. Со временем память накапливает информацию о том, какое поведение оптимально в той или иной ситуации с точки зрения максимизации положительных эмоций. Память начинает оказывать влияние на исполнительные устройства. Чисто рефлекторное поведение сдвигается в сторону инстинктивного.
Рассмотрим, как это происходит. Пока память чиста, состояние исполнительных нейронов определяется нейронами рефлексов. Сталкиваясь с ситуациями, «прошитыми» в рефлексах, наше устройство будет выполнять действие, предусмотренное ими. Какие рефлексы целесообразны — это определяется естественным отбором. Применительно к живым существам можно сказать, что возникнут и зафиксируются рефлексы, которые обеспечат поведение, способствующее:
— выживанию и размножению;
— скорейшему обучению инстинктивному поведению.
При совершении различных действий, на которые толкнули рефлексы, будет меняться состояние нейронов-«эмоций». То, какие будут возникать эмоции, зависит от нейронов-«эмоциональных рефлексов». Они распознают картину на «датчиках» и «трактуют» ее как «хорошо» или «плохо». Сам факт оценки ситуации в терминах эмоций не влечет никаких немедленных действий, память просто фиксирует все ситуации, в которых менялся эмоциональный фон. Другими словами, каждый нейрон памяти фиксирует воспоминание об определенной ситуации (что это за ситуация, определяется уже состоянием нейронов- «датчиков») и запоминает информацию о том, привело ли совершенное в этой ситуации действие к улучшению или ухудшению эмоционального состояния.
Далее нейроны памяти, «узнавая» ситуации, которые соответствуют их «опыту», начинают вносить свой вклад в формирование поступков. За счет процессов активации они стимулируют к действиям, которые дали улучшение состояния, а за счет процессов торможения предостерегают от поступков, которые привели к его ухудшению. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине на датчиках одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. В таких ситуациях накопление опыта приведет к тому, что исполнительные нейроны, суммируя сигналы возбуждения и торможения, будут выбирать то действие, при котором выше вероятность положительных изменений эмоционального состояния.
Теперь вернемся к слову «узнаёт», использованному при описании нейронов «памяти». Можно по-разному реализовать такое узнавание практически, и каждый вариант даст работоспособный механизм. Например:
— Фиксировать точное повторение картины на датчиках (с учетом активности и неактивности). Хорошо, когда датчиков мало или же нейроны памяти имеют связи не со всей сенсорной зоной (назовем так множество датчиков), а только с отдельной областью датчиков, объединенных по некому сходству.
— Определять расстояние между точками евклидова пространства, координаты которых соответствуют значениям на связях нейронов, и сравнивать его с неким пороговым значением.
Возможны и другие алгоритмы.
Представим себе сообщество автоматов, управляемых такими «мозгами», помещенное в некую среду обитания, где возможна гибель. Дадим автоматам возможность размножаться. Теперь можно представить себе их эволюцию. Не будем рассматривать возможность изменения конструкции автоматов за счет появления новых датчиков, исполнительных устройств и увеличения памяти. Роль мутаций, дающих изменчивость, будут выполнять новые связи между исполнительными нейронами и «рефлексами», «рефлексами» и «датчиками», «датчиками» и «эмоциональными рефлексами», «эмоциональными рефлексами» и «эмоциями». Случайным образом, добавляя или удаляя связи, мы будем получать у автоматов новое поведение, и... «Пусть победит сильнейший!»
Если мы захотим усовершенствовать наше устройство, то, оглядываясь на мозг человека, можем понять, что у нас в запасе — множество «эволюционных приемов». Например:
— Можно заняться топологией устройства. К примеру, расположить датчики на плоскости (сенсорный слой) и сгруппировать их по признаку переносимой ими информации (звуковой, зрительной и т. п. Далее разместить нейроны памяти «слоем коры» над ними и охватить связями преимущественно те зоны, над которыми они находятся, придав тем самым памяти деление на предметные области).
— Нейронам памяти можно дать возможность иметь связи между собой, позволив им включать память в картину текущего представления и тем самым, изменив распознавание, сделать его более устойчивым к стереотипным ситуациям.
— Можно надстроить более высокие слои памяти, которые позволят распознавать и запоминать более сложные, «абстрактные» конструкции.
— Можно ввести механизм импринтинга — когда по какому-то набору признаков будет распознаваться некий объект, ситуация, состояние, и будет осуществляться их привязка к определенным наборам эмоций и рефлексов (при этом инстинкт будут направлен не на те признаки, которые вызвали срабатывание импринтинга, а на зафиксированное памятью явление, распознаваемое по дополнительным признакам, которые изначально отсутствовали).
— Можно использовать синхронизированную импульсную активность нейронов, которая позволит реализовать «голографическую память» и применить новые способы «узнавания».
— Можно использовать для передачи информации между нейронами не только существующие связи, но и ввести некие управляющие сигналы, доступные сразу всем нейронам «мозга» автомата, и с их помощью реализовать, например, работу «регулятора».
— Можно увеличить количество эмоций, сделать их картину значительно более сложной.
— Можно ввести «промежуточные ощущения», которые будут формироваться и датчиками и памятью, и сделать возможным процесс «фантазии».
— Можно ввести параметр «сила эмоции» и учитывать его при «запоминании».
В общем, нет предела совершенству...
Вообще-то, используя такой механизм, можно создавать устройства, применимые в любых сферах человеческой деятельности. Что особо приятно, так это то, что совершенно необязательно, имея устройство с начальной матрицей рефлексов и инстинктов, «воспитывать» его каждый раз с нуля. Имея уже обученное устройство со сформированной памятью, его можно просто копировать. Получать же набор удачных рефлексов и инстинктов можно на компьютерах, моделируя естественный отбор и мутации. Вот уж действительно достойная задача для суперкомпьютеров!
Описанную конструкцию с некоторыми оговорками можно назвать одной из разновидностей персептрона. Персептрон — нейронная сеть, состоящая изходных, ассоциативных и реагирующих элементов, с переменной матрицей взаимодействия, определяемой последовательностью прошлых состояний активности сети. Термин был введен Фрэнком Розенблаттом в 1957 году. Ему же принадлежит первая реализация в виде электронной машины «Марк-1» в 1960 году. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером (Rosenblatt, 1962).
Сам принцип, когда новый опыт изменяет структуру нейронной сети, называется «обучение с подкреплением». В нашем случае система подкрепления — это эмоции и характер их участия в формировании памяти. «Регулятор» можно трактовать как систему управления подкреплением.