Коннекционистские модели
Коннекционистские модели
В отличие от гибридных, коннекционистские модели используют сети для описания не только активационных процессов, но и процессов переработки информации. Описание сетей тоже получается несколько иным – понятие может быть связанным не с одним каким-либо узлом, а с целым их набором. Соответственно, и отношения между узлами не оказываются более отношением между понятиями. В коннекционистских моделях в основу функционирования сети положен принцип параллельности.
На сегодняшний день в когнитивизме наиболее распространенным является моделирование с помощью параллельных распределенных сетей. На рисунке 2.13 приведен фрагмент сети, примененной Д. Румелхартом и Дж. Мак-Клелландом для их модели овладения ребенком прошедшим временем английских глаголов, выполненной в рамках подхода параллельной распределенной переработки информации (Rumelhart, McClelland, 1986).
Модель имеет сеть, включающую четыре слоя нейроноподобных элементов, или узлов. Один слой узлов является входным, два – промежуточными (или ассоциативными), четвертый – выходным. Возбуждение распространяется от первых слоев к следующим через дуги между узлами. Связи между первым и вторым, а также третьим и четвертым слоями рассматриваемой модели являются жестко фиксированными. Связи между вторым и третьим слоями могут изменяться в процессе обучения. Изменению в ходе обучения подвержен также порог активации элементов третьего слоя.
Рис. 2.13. Фрагмент сети модели Д Румелхарта и Дж. Мак-Клелланда
Если подавать на входные узлы сети активацию, сеть будет реагировать – выдавать определенный паттерн активации на выходе. Например, сеть Румельхарта и Мак-Клелланда на входе получает инфинитив глагола, а на выходе выдает прошедшее время (каждый входной и выходной узел модели кодирует один звук). Сеть можно обучать: если она выдает неправильный ответ, по определенному алгоритму модифицируются связи между ассоциативными слоями.
Наиболее интересным в моделях такого типа является то, что они показывают весьма любопытное сходство с реальным поведением людей. В частности, модель Румельхарта и Мак-Клелланда на определенном этапе обучения, как и дети, демонстрирует сверхгенерализацию (например, выдает gived вместо gave), на другом этапе – появление частных правил и т. д.
Показана способность параллельных распределенных сетей и к более сложной переработке информации. Так, Г. Хинтон создал модель, которая обучается определению родственных отношений (Hinton, 1986). На ее входные узлы подают имена людей и учат устанавливать между ними родственные отношения. Была показана способность этой модели к простым умозаключениям. Так, если дать ей некоторое количество отношений типа «Иван отец Петра», «Петр отец Сидора», «Иван дед Сидора», то сеть из «Джон отец Джека» и «Джек отец Джима» может сама вывести «Джон дед Джима». Интересно, что анализ функционирования отдельных узлов промежуточных слоев показывает образование понятий, таких как пол, поколение, принадлежность к семье и т. д. Другими словами, некоторые узлы срабатывали только в отношении лиц старшего поколения, другие – только в отношении женщин и т. д.
Коннекционистские модели обладают определенной привлекательностью в силу ряда причин: подобия нашей нейрофизиологической организации (или по крайней мере тому, что мы о ней сегодня знаем), способности естественным образом моделировать некоторые процессы, высокой точности и возможности компьютерного моделирования, но при принципиальном отличии по архитектуре от компьютера и т. д. Они позволяют объяснить такие феномены, которые оказываются непонятными для информационных моделей, лишенных сетевой составляющей. К таким феноменам относится, например, облегчающее влияние контекста на решение задач.
В то же время некоторые авторы высказывают сомнение по поводу того, что коннекционизм может стать главным средством моделирования познавательных процессов. Так, Дж. Фодор и З. Пылишин доказывают, что коннекционистские модели в принципе не обладают вычислительной мощью, позволяющей выполнять в полном объеме пропозициональное исчисление, и, следовательно, не могут объяснить всех возможностей познавательной системы человека.
Данный текст является ознакомительным фрагментом.