Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы - Станислас Деан
Эксперименты Танифудзи внесли существенный вклад в понимание того, как наша височная кора кодирует зрительные образы – даже те, которые мы видим впервые. Секрет заключается в алфавите элементарных форм, каждая из которых кодируется определенными популяциями нейронов и миллионами их потенциальных комбинаций. Различные клетки реагируют не только на разные части объекта; их интересует, как составляющие предмета расположены в пространстве. Подобный комбинаторный код существует на каждом иерархическом уровне зрительной системы. При движении от низших уровней к высшим масштаб и степень сложности предпочитаемых форм возрастают. Первичная зрительная область (V1) главным образом отвечает за обнаружение тонких линий и контуров объектов. Во вторичной зрительной области (V2) нейроны уже чувствительны к сочетаниям линий с четко выраженными наклонами или кривыми[230]. Еще выше, в задней части нижневисочной коры (в так называемой области TEO) клетки реагируют на простые комбинации кривых[231]. Избирательная реакция нейронов – скажем, на букву F – может быть сведена к обнаружению простого сочетания элементарных кривых, каждая из которых расположена в относительно фиксированном месте: верхняя полоса, верхний левый угол, средняя полоса и так далее. Аналогичная схема, по-видимому, повторяется на каждом уровне: нейронная избирательность есть результат объединения элементов, кодируемых нейронами предыдущих ярусов.
Протобуквы
Возможно, самая поразительная особенность нейронов нижневисочной коры заключается в следующем: многие из предпочитаемых ими форм очень напоминают наши буквы, символы или элементарные китайские иероглифы (рис. 3.4 и 3.6). Одни клетки реагируют на два соприкасающихся круга, образующих восьмерку, другие – на пересечение двух черточек, образующих букву Т, третьи же предпочитают астериск, круг, букву «J», букву «Y»… По этой причине мне нравится называть их протобуквами. То, что эти формы столь глубоко встроены в предпочтения нейронов макак, удивительно. По какому необычайному стечению обстоятельств этот корковый «алфавит» так похож на тот, который мы унаследовали от евреев, греков и римлян? Парадокс чтения поистине достигает своего апогея в этом таинственном сходстве между двумя мирами, которые мы считали дискретными: глубинами коры головного мозга обезьяны и поверхностью глины, тростника и пергамента, на которые первые писцы наносили свои письмена.
Некоторое представление о происхождении этих обезьяньих протобукв можно получить, изучив причину их появления в зрительном поле. Наиболее правдоподобная гипотеза состоит в том, что эти фигуры были отобраны либо в ходе эволюции, либо в результате зрительного научения как составляющие общего «алфавита» форм, необходимых для анализа зрительной сцены. Форма Т, например, чрезвычайно часто встречается в естественных сценах. Всякий раз, когда один объект маскирует другой, их контуры образуют Т-образное соединение. Значит, нейроны, выполняющие функцию «Т-детекторов», помогают определить, какой объект находится перед каким.
Другие распространенные конфигурации, такие как формы Y и F, обнаруживаются в точках схождения нескольких граней – они характеризуют острые углы и их ориентацию. Формы J и 8 присущи объектам с кривыми и отверстиями. Все эти фрагменты фигур относятся к так называемым неслучайным свойствам зрительных сцен, поскольку они вряд ли могут возникнуть произвольно в отсутствие какого-либо объекта вообще. Если вы бросите на пол горсть спичек, маловероятно, что две из них образуют Т-образное пересечение, и еще менее вероятно, что три из них дадут конфигурацию в виде буквы Y. Следовательно, когда одна из этих форм появляется на сетчатке, мозг может быть уверен, что она соответствует контуру некоего объекта во внешнем мире.
Если кора считает нужным кодировать неслучайные свойства, то это, несомненно, потому, что их комбинации крайне стабильны относительно изменений размера, освещения и угла обзора. Если взять кофейную чашку и повертеть ее в руке, края чашки образуют два противоположных F-пересечения. Даже с одним закрытым глазом практически невозможно найти положение, под которым край и боковые стороны чашки находятся под прямым углом: как только исчезает две F наверху, тут же появляются две F внизу.
Во многих случаях перечень фигур, образуемых пересечением ребер, представляет собой инвариант, ограничивающий возможность идентификации объекта независимо от угла представления. По всей вероятности, наша нервная система приматов обнаружила это инвариантное свойство и использовала его для кодирования форм. Зрительные сцены обладают и многими другими неслучайными качествами. Одно из них – параллелизм: маловероятно, что изображение будет содержать два параллельных сегмента, если только они не являются гранями трехмерного объекта. Другие инварианты связаны с пространственной организацией: если объект содержит отверстие, то его проекция на сетчатку, вероятно, будет включать замкнутую О-образную кривую. Зрительные инварианты, подобные этим, настолько узнаваемы, что прочно внедрены в нашу нервную систему. Согласно калифорнийскому психологу Ирвингу Бидерману, наша память вовсе не хранит детализированные визуальные образы объектов. Она просто извлекает схему их неслучайных свойств, организации и пространственных отношений[232]. Это позволяет нам сначала воссоздать элементарные части, составляющие трехмерную структуру объекта (поверхности, конусы, палочки), а затем собрать их в единую репрезентацию его формы. Главное преимущество такого кода – стабильность и постоянство при вращении, окклюзии[233] и присутствии других факторов, ухудшающих качество изображения.
Чтобы подтвердить свою гипотезу, Бидерман собрал доказательства того, что человеческое восприятие объекта в большей степени зависит от неслучайных свойств, нежели от других аспектов изображения. Например, если взять линейный снимок объекта, а затем удалить половину контуров, то его восприятие будет зависеть от того, сохранились ли неслучайные свойства:
• Если удалить сегменты линий, связывающие две вершины, и оставить нетронутыми неслучайные пересечения, распознавание объекта не вызывает сложностей.
• Если удалить все неслучайные свойства, распознавание становится практически невозможным (рис. 3.7)[234].
Рис. 3.7. Сложные объекты распознаются по расположению их контуров. В точках пересечения контуры образуют воспроизводимые конфигурации в виде букв T, L, Y или F. Их удаление существенно усложняет распознавание изображения (левый столбик). Удаление эквивалентного количества контуров, не затрагивающих такие соединения, не приводит