Марвин Минский - Фреймы для представления знаний
Глава пятая
Пространственные образы
5.1. Местоположение и ориентация
Обычно мы представляем себе, что наше движение происходит в неподвижном пространстве: когда мы поворачиваемся, мир не вращается вместе с нами, когда мы продвигаемся вперед, мир не отступает. Сидя за письменным столом, я считаю, что видимая из окна река течет на север, хотя на самом деле она сильно отклоняется от точного направления на Северный полюс. Это представление я получил много лет назад, будучи в другом населенном пункте, расположенном на той же реке: там она действительно течет на север. Такое ощущение направления относится ко всей окружающей обстановке; тот же «север» существует в любом доме, своем и соседнем, а любой неподвижный предмет также характеризуется своим направлением (ориентацией) в пространстве.
Кроме ориентации каждый предмет характеризуется определенным местоположением. Мы менее уверены в существовании каких-то связей между позициями, находящимися в разных комнатах. Частично это происходит от того, что определение местоположения любого предмета всегда требует вычислений, тогда как установление связей между ориентированными объектами — дело более простое (в прямоугольных комнатах направления просто переносятся из одного замкнутого пространства в другое).
В незнакомой обстановке одни люди ориентируются значительно легче, чем другие. Один мой знакомый постоянно сверяет свои ощущения с компасом и никогда не теряется в новом для себя городе. Лишь небольшая часть его умения ориентироваться базируется на правильном использовании данных о проделанных в ходе движения по улицам поворотах. Он использует разные средства: карты, тени, время дня, ориентиры (включая отражения от окон) и т. д. Вначале этот способ кажется громоздким, но на самом деле он не требует слишком больших усилий. Весь фокус состоит в том, что надо выработать в себе привычку подмечать и должным образом представлять подобные вещи.
Сформировавшиеся представления об ориентации объектов довольно устойчивы и их трудно менять, даже когда для этого имеются веские основания. В конце концов я понял, что около моего дома река имеет излучину, однако это не убедило меня в том, что следует пересмотреть свою укрупненную пространственную модель. Еще один пример: я провел в Бостоне многие годы, прежде чем заметил, что его Центральный парк имеет пятиугольную форму. Я настолько привык к прямоугольному Манхэттену, что никак не мог справиться с этой неэвклидовой бессмыслицей, ибо в моей памяти отсутствовал угловой сектор для представления северной части Бостона.
Такие трудности указывают на то, что нами используются как глобальные эталонные фреймы, так и более мелкие локальные структуры. Трудности при перестройке представлений свидетельствуют, что локальные фреймы не являются полностью трансформируемыми структурами, а при уточнении межпредметных связей зависят от места их присоединения к глобальным фреймам. Ниже рассматриваются некоторые вопросы использования глобальных эталонных систем: в принципе это должно предполагать наличие более мощных и общих процедур для частичного изменения сложных представлений; на практике возможности людей в этом плане сильно ограничены, особенно когда они находятся в условиях жесткого дефицита времени.
5.2. Глобальная система пространственных фреймов
Мне не очень нравится предлагаемая ниже модель, но для систем ИИ раньше или позже нечто подобное непременно потребуется разработать. Глобальный пространственный фрейм (GSF) представляет собой постоянный набор «типичных позиций» в абстрактном трехмерном пространстве, копии которого используются как каркасы для сборки сложных сцен. Такой каркас можно представить себе в виде расположенной в горизонтальной плоскости решетки (матрицы) размером (5×5), каждый узел («позиция») которого имеет три вертикальных уровня. Центральные ячейки служат для представления сведений, наиболее близких к основному в GSF понятию, а периферийные представляют собой менее значительные понятия. (В сущности, человек всегда представляет себе, что он находится в универсальной воображаемой комнате, в которой происходят реальные события. Люди, вероятно, в жизни своей используют более сложные и математически менее строгие структуры, например, чтобы подчеркнуть простоту доступа к объектам, находящимся вблизи рук или лица, или чтобы представлять пространство не в чисто метрических категориях, а по отношению к своим манипуляционным возможностям.
GSF связан с системой видовых фреймов; каждый видовой фрейм описывает визуальные характеристики GSF со своей «колокольни». Таким образом, этот подход не противоречит одновременно ни системе Коперника, ни системе Птолемея: перемещения наблюдателя никак не влияют на присутствие в GSF образа видимой им сцены, однако активация видового фрейма, соответствующего данному конкретному местоположению наблюдателя, представляет его воображению именно ту картину, которую он и должен видеть.
Видовой фрейм, соответствующий определенной позиции наблюдателя, получается путем проектирования на это место ячеек GSF. Результатом является массив видовых перечней, каждый из которых представляет собой упорядоченную последовательность тех ячеек GSF, которые должны пересекаться лучом, исходящим от наблюдателя. Таким образом, видовой фрейм подобен обычному визуальному фрейму, за исключением того, что его элементы получены из GSF, а не в результате наблюдений за отдельными элементами и связями реальных объектов. Поскольку видовые перечни соответствуют участкам сетчатки, нам они представляются трехмерными зонами, вытянутыми вдоль одного общего для данного перечня направления.
Заслонения объясняются или представляются с помощью предписаний для видовых перечней; нам не следует ожидать, что удастся увидеть целиком тот объект, который не находится на первом месте в видовом перечне. (Аналогично, более близкие к началу перечня предметы препятствуют выполнению манипуляций с другими предметами, находящимися дальше в этом списке. Заслоненные ячейки перечней видов предоставляют процессу согласования большую свободу, ибо они устраняют часть ограничений соответствующих терминалов.)
Для усвоения визуальной информации, полученной из разных точек наблюдения, нам необходимо нечто наподобие схемы «косвенной адресации», в которой визуальные черты приписываются видовым перечням посредством каркасных конструкций GSF. Ниже приводится предварительный набросок такой схемы.
ЗРИТЕЛЬНОЕ ВОСПРИЯТИЕ. Разнообразные типы визуальных «черт» распознаются с помощью демонов на уровне сетчатки. Каждая обнаруженная черта автоматически связывается с видовым направлением текущего видового перечня в соответствии с его положением на общем визуальном поле.
АКТИВАЦИЯ ФРЕЙМОВ. Одновременно производится предварительное присоединение некоторого предметного фрейма или некоторого вида ожидания к узлам решетки GSF в соответствии с данным направлением текущего видового перечня. Это означает, что каждый терминал связывается с видовым направлением некоторого вшивного видового перечня. (Иными словами, терминалы визуального фрейма содержат пространственно-сориентированные данные, что оказывается возможным благодаря наличию соответствующих указателей в структуре GSF), в рамках одной системы различные визуальные фреймы выбираются согласно текущему видовому фрейму, а направления всех объектов должны быть соответственно откорректированы.
КОНКРЕТИЗАЦИЯ. Когда мы смотрим в определенном направлении, то, во-первых, в соответствии с информацией активного фрейма ожидаем увидеть определенные визуальные черты в определенных зрительных областях, соответствующих данным GSF, и, во-вторых, на самом деле видим их там. Поэтому естественно предложить такую теорию зрительного восприятия (первого порядка), в которой каждый маркер каждого терминала фактически задает некоторый класс визуальных демонов — «признаков» так же, как и предполагаемое местоположение соответствующего узла в GSF. В такой системе наблюдатель может быть тоже представлен как объект и это позволит ему «увидеть» себя из разных мест в качестве полноправного элемента сцены. При наличии всего этого довольно легко получить информацию, требуемую для означивания терминалов и конкретизации фреймов. Системе остается лишь сопоставить «перцептуальные» пары (демон, видовой перечень) со «схематическими» парами (маркер, узел). Если бы терминалы предметных фреймов можно было непосредственно присоединять к узлам GSF, и если бы они автоматически проектировались и образовывали видовые перечни, то это бы почти полностью избавило систему от необходимости проведения повторных вычислений для представления тех объектов, которые уже наблюдались, но только из других положений.