Дмитрий Ушаков - Психология интеллекта и одаренности
Время, необходимое для извлечения чанка из памяти описывается уравнением:
Ti = Fe-Aj,
где Ti – время извлечения (время реакции), а F – шкалирующий параметр, приводящий полученные значения к единицам времени реакции.
Из данного уравнения следует, что чем меньше активация элемента, тем больше время его извлечения из памяти.
Эффект веера (fan-effect) – классический пример, с помощью которого можно проиллюстрировать приложение модели ACT-R к объяснению и предсказанию психологических феноменов. Его обнаружил Андерсон, проводя эксперименты под руководством Г. Бауэра (Anderson, 1974). Эффект веера – это увеличение времени реакции на стимул за счет увеличения количества элементов, связанных с ним.
В одном из экспериментов испытуемым предлагали заучивать предложения о персонажах и их местонахождении. Предложения были подобраны так, чтобы персонажи и места имели разное количество фактов с ними связанных. Например:
1) доктор в банке (1–1)
2) пожарник в парке (1–2)
3) адвокат в церкви (2–1)
4) адвокат в парке (2–2)
Из приведенного примера видно, что персонаж «доктор» встречается только в одном из предложений, а персонаж «адвокат» – двух. Подобным образом можно определить количество ассоциированных фактов для всех персонажей и местонахождений.
После того как испытуемые заучивали эти факты, им предъявлялась другая серия предложений, среди которых были как те, которые они заучивали (например, «адвокат в церкви»), так и те, которых в первоначальном списке не было (например, «адвокат в банке»). Испытуемым нужно было узнать, какие из предложений они заучивали, а какие – нет. Оказалось, что время реакции при опознании предложения зависит от количества фактов, ассоциированных с элементами этого предложения: при увеличении числа фактов, скорость опознания снижается. Например, предложение «доктор в банке», опознается существенно быстрее, чем «адвокат в парке».
С точки зрения уравнения , основной параметр, который варьировался в эксперименте – это Sji. При увеличении «веера» элемента (т. е. количества связей с другими элементами) его сила связи с другими элементами ослабляется (согласно формуле Sji = S – ln(fanj)), следовательно, уменьшается активация, поступающая от него чанку, требующему извлечения, и в итоге увеличивается время извлечения.
Покажем, каким образом гибридная модель Андерсона может сочетаться с двухполюсной концепцией творчества. Фактически работа системы продукций осуществляет то, что Пономарев относил к логическому полюсу. Продукции работают строго детерминистически, осуществляя трансформацию исходной модели события в новый вариант. Модель событий при этом образована совокупностью декларативных знаний, активированных в данный момент времени в рабочей памяти.
В то же время процесс распространения активации может быть кандидатом на объяснение ряда процессов, связанных с тем, что Пономарев называл интуицией. В самом деле, согласно теории Пономарева, роль интуиции заключается в том, чтобы снабжать наш логический аппарат, т. е. создаваемые модели действительности, информацией о свойствах объектов. Именно это и делает семантическая сеть, движение активации по которой приводит к вхождению в рабочую память (= умственную модель) элементов знания, хранящихся в долговременной памяти. Другими словами, механизм интуиции можно представить как систему связей между элементами информации в нашей долговременной памяти, которая формируется независимо от наших сознательных усилий и позволяет в нужный момент актуализировать нужное содержание.
В модели Андерсона отсутствует представление о различии интуитивного и логического режимов функционирования когнитивной системы. Однако такое представление совместимо с моделью, если предположить возможность различных состояний сети. В логическом состоянии активация сети включает немногочисленные элементы, которые в соответствии с веерным эффектом при этом могут быть активированы в большей степени. Высокая степень активации элементов позволяет осуществлять с ними логические операции, однако при этом невысоким оказывается количество элементов, включенных в решение.
Коннекционистские модели
В отличие от гибридных, коннекционистские модели используют сети для описания не только активационных процессов, но и процессов переработки информации. Описание сетей тоже получается несколько иным – понятие может быть связанным не с одним каким-либо узлом, а с целым их набором. Соответственно, и отношения между узлами не оказываются более отношением между понятиями. В коннекционистских моделях в основу функционирования сети положен принцип параллельности.
На сегодняшний день в когнитивизме наиболее распространенным является моделирование с помощью параллельных распределенных сетей. На рисунке 2.13 приведен фрагмент сети, примененной Д. Румелхартом и Дж. Мак-Клелландом для их модели овладения ребенком прошедшим временем английских глаголов, выполненной в рамках подхода параллельной распределенной переработки информации (Rumelhart, McClelland, 1986).
Модель имеет сеть, включающую четыре слоя нейроноподобных элементов, или узлов. Один слой узлов является входным, два – промежуточными (или ассоциативными), четвертый – выходным. Возбуждение распространяется от первых слоев к следующим через дуги между узлами. Связи между первым и вторым, а также третьим и четвертым слоями рассматриваемой модели являются жестко фиксированными. Связи между вторым и третьим слоями могут изменяться в процессе обучения. Изменению в ходе обучения подвержен также порог активации элементов третьего слоя.
Рис. 2.13. Фрагмент сети модели Д Румелхарта и Дж. Мак-Клелланда
Если подавать на входные узлы сети активацию, сеть будет реагировать – выдавать определенный паттерн активации на выходе. Например, сеть Румельхарта и Мак-Клелланда на входе получает инфинитив глагола, а на выходе выдает прошедшее время (каждый входной и выходной узел модели кодирует один звук). Сеть можно обучать: если она выдает неправильный ответ, по определенному алгоритму модифицируются связи между ассоциативными слоями.
Наиболее интересным в моделях такого типа является то, что они показывают весьма любопытное сходство с реальным поведением людей. В частности, модель Румельхарта и Мак-Клелланда на определенном этапе обучения, как и дети, демонстрирует сверхгенерализацию (например, выдает gived вместо gave), на другом этапе – появление частных правил и т. д.
Показана способность параллельных распределенных сетей и к более сложной переработке информации. Так, Г. Хинтон создал модель, которая обучается определению родственных отношений (Hinton, 1986). На ее входные узлы подают имена людей и учат устанавливать между ними родственные отношения. Была показана способность этой модели к простым умозаключениям. Так, если дать ей некоторое количество отношений типа «Иван отец Петра», «Петр отец Сидора», «Иван дед Сидора», то сеть из «Джон отец Джека» и «Джек отец Джима» может сама вывести «Джон дед Джима». Интересно, что анализ функционирования отдельных узлов промежуточных слоев показывает образование понятий, таких как пол, поколение, принадлежность к семье и т. д. Другими словами, некоторые узлы срабатывали только в отношении лиц старшего поколения, другие – только в отношении женщин и т. д.
Коннекционистские модели обладают определенной привлекательностью в силу ряда причин: подобия нашей нейрофизиологической организации (или по крайней мере тому, что мы о ней сегодня знаем), способности естественным образом моделировать некоторые процессы, высокой точности и возможности компьютерного моделирования, но при принципиальном отличии по архитектуре от компьютера и т. д. Они позволяют объяснить такие феномены, которые оказываются непонятными для информационных моделей, лишенных сетевой составляющей. К таким феноменам относится, например, облегчающее влияние контекста на решение задач.
В то же время некоторые авторы высказывают сомнение по поводу того, что коннекционизм может стать главным средством моделирования познавательных процессов. Так, Дж. Фодор и З. Пылишин доказывают, что коннекционистские модели в принципе не обладают вычислительной мощью, позволяющей выполнять в полном объеме пропозициональное исчисление, и, следовательно, не могут объяснить всех возможностей познавательной системы человека.
Сети Хопфилда
Специально рассмотрим вид сетей, предложенный Дж. Хопфилдом, поскольку эти сети привлекли особое внимание в контексте проблемы творчества. В этих сетях каждый нейрон может принимать одно из двух состояний. В них нет входных, промежуточных и выходных слоев, однако, как показано на рисунке 2.14, есть обратные связи.