Алексей Редозубов - Мозг напрокат. Как работает человеческое мышление и как создать душу для компьютера
Изначально все поступки — следствия рефлексов. Эмоции не «толкают» нас на какое-либо поведение. Эмоции «дают оценку» всему, что происходит. Всегда присутствует итоговая скалярная оценка по шкале «хорошо/плохо». Итоговая оценка фиксируется памятью вместе с «ситуацией», которая вызвала эту оценку. «Ситуации» содержат в себе не только внешнюю картину мира, но и нашу реакцию на нее, наши поступки. Память впоследствии, реагируя на внешнее воздействие, «заставляет» совершать какие-либо действия или «препятствует» им. Причем действия, которые мы совершаем исходя из нашего опыта, с наибольшей вероятностью, в сравнении с другими возможными действиями, будут вести к положительному изменению эмоционального состояния. Эмоции, которые сопровождают наши поступки, нельзя трактовать как «побудители действия», это — оценки происходящего, которые нужны для формирования опыта.
Рисунок 13. Пример простейшего мозга, построенного на формальных нейронах.
Рассмотрим устройство, изображенное на рис. 13.
Каждый из кружочков обозначает некий формальный нейрон — искусственный аналог нейрона реального мозга. За исключением «регулятора», который сам является несложной конструкцией из нейронов. В устройстве используется несколько, немного различных по свойствам, типов нейронов.
Опишем их.
— «Датчики», то есть нейроны, которые получают некую информацию об окружающем мире и находятся в состоянии активности, пока присутствует то раздражение, на которое они реагируют.
— «Исполнительные нейроны» — они активируются в том случае, если сумма сигналов входов превышает некое пороговое значение. Активировавшись, исполнительные нейроны приводят в действие связанные с ними исполнительные устройства. При прекращении условия активации нейроны возвращаются в неактивное состояние и прекращают работу исполнительного устройства. Сигналы, приходящие на входы исполнительных нейронов, могут быть активирующие (+1) или тормозящие (-1). Пороговое значение можно сделать зависящим от числа активных входов.
— «Рефлексы» — нейроны, связи которых изначально определены. Эти связи образуют матрицу рефлексов. Сами нейроны активируются при возникновении строго определенной картины активности датчиков, причем сочетание активности датчиков, которое к этому приводит, задается изначально. В случае активации рефлексы дают активирующий (+1) либо тормозящий (-1) сигнал исполнительным нейронам.
— «Эмоциональные рефлексы» — нейроны, которые работают так же, как и рефлексы, с той лишь разницей, что активирующие сигналы поступают на эмоции.
— «Эмоции» — нейроны, которые активируются в случае активации замкнутых на них эмоциональных рефлексов. Совокупность активности нейронов- «эмоций» образует «эмоциональный фон», то есть то, как воспринимает и оценивает наше устройство отраженный через датчики окружающий мир. Изменение состояния датчиков может привести к изменению эмоционального фона. Каждый раз, когда происходит изменение эмоционального фона, то есть меняется состояние любого из нейронов-«эмоций», будем фиксировать на одном из нейронов памяти текущую картину активности. Отвечает за этот процесс «регулятор». Он выбирает свободный нейрон и дает ему команду на запоминание, а также сообщает, как изменилось эмоциональное состояние (+1 или -1).
Изменение эмоционального состояния будем оценивать следующим образом:
(+1) — если изменение привело к улучшению эмоционального фона, то есть возросла величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона- «эмоции»). Например, (+1) возникает, когда появляется положительная эмоция («хорошо») или прекращается отрицательная эмоция («плохо»).
(-1) — если изменение привело к ухудшению эмоционального фона, то есть уменьшилась величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона- «эмоции»). Например, (-1) возникает, когда появляется отрицательная эмоция («плохо») или прекращается положительная эмоция («хорошо»).
Если с изменением состояния обоих нейронов-«эмоций» итоговое эмоциональное состояние не изменилось, то на выбор читателя можно не запоминать такое событие или ввести принцип доминирования одной эмоции над другой.
— «Память» — нейроны, которые могут находиться в трех режимах.
Режим 1. Изначально все нейроны памяти девственно чисты и не оказывают влияния на работу системы.
Режим 2. По команде «регулятора» нейроны памяти способны фиксировать картину активности других нейронов, связанных с ними (датчиков, эмоций, исполнительных нейронов). Фиксируется состояние активности на связях и направление изменения эмоционального состояния системы — (+1) или (-1).
Режим 3. Запомнив свою картину, нейрон памяти переходит в новое состояние. В этом состоянии нейрон активируется, если «узнаёт» картину активности, которая соответствовала моменту запоминания. Чтобы не тормозить повествование, я расшифрую несколько позже понятие «узнаёт». Активировавшись в случае определенного рода «повторения» картины активности нейронов, соответствующей моменту запоминания, нейрон памяти подает сигналы по всем направлениям, которые были активны в момент запоминания. Причем если в момент запоминания изменение эмоционального состояния имело значение (+1), то сигнал подается активирующий (+1), если же значение было (1), то тормозящий (-1).
— «Регулятор» — это, скорее, не отдельный нейрон, а некий узел, который можно собрать из более простых «классических» нейронов, но сейчас не хотелось бы отвлекаться на описание его возможного устройства. Регулятор дает команды нейронам памяти на запоминание и сообщает им направление изменения эмоционального состояния.
Такое устройство, которое, кстати, несложно реализовать на практике, ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. Но, кроме рефлексов, устройство имеет возможность формировать инстинкты, то есть способность испытывать эмоции и запоминать события, приводящие к их изменениям. Со временем память накапливает информацию о том, какое поведение оптимально в той или иной ситуации с точки зрения максимизации положительных эмоций. Память начинает оказывать влияние на исполнительные устройства. Чисто рефлекторное поведение сдвигается в сторону инстинктивного.
Рассмотрим, как это происходит. Пока память чиста, состояние исполнительных нейронов определяется нейронами рефлексов. Сталкиваясь с ситуациями, «прошитыми» в рефлексах, наше устройство будет выполнять действие, предусмотренное ими. Какие рефлексы целесообразны — это определяется естественным отбором. Применительно к живым существам можно сказать, что возникнут и зафиксируются рефлексы, которые обеспечат поведение, способствующее:
— выживанию и размножению;
— скорейшему обучению инстинктивному поведению.
При совершении различных действий, на которые толкнули рефлексы, будет меняться состояние нейронов-«эмоций». То, какие будут возникать эмоции, зависит от нейронов-«эмоциональных рефлексов». Они распознают картину на «датчиках» и «трактуют» ее как «хорошо» или «плохо». Сам факт оценки ситуации в терминах эмоций не влечет никаких немедленных действий, память просто фиксирует все ситуации, в которых менялся эмоциональный фон. Другими словами, каждый нейрон памяти фиксирует воспоминание об определенной ситуации (что это за ситуация, определяется уже состоянием нейронов- «датчиков») и запоминает информацию о том, привело ли совершенное в этой ситуации действие к улучшению или ухудшению эмоционального состояния.
Далее нейроны памяти, «узнавая» ситуации, которые соответствуют их «опыту», начинают вносить свой вклад в формирование поступков. За счет процессов активации они стимулируют к действиям, которые дали улучшение состояния, а за счет процессов торможения предостерегают от поступков, которые привели к его ухудшению. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине на датчиках одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. В таких ситуациях накопление опыта приведет к тому, что исполнительные нейроны, суммируя сигналы возбуждения и торможения, будут выбирать то действие, при котором выше вероятность положительных изменений эмоционального состояния.
Теперь вернемся к слову «узнаёт», использованному при описании нейронов «памяти». Можно по-разному реализовать такое узнавание практически, и каждый вариант даст работоспособный механизм. Например: