Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы - Станислас Деан
Разумеется, должен существовать некий устойчивый код, способный противостоять такой алфавитной путанице. Пытаясь разгадать эту загадку, Грейнджер и Уитни пришли к идее открытых биграмм. Они предположили, что слова могут кодироваться не как перечень букв, а как перечень пар букв. Согласно предложенной ими схеме, слово «badge» кодируется десятью биграммами: BA, BD, BG, BE, AD, AG, AE, DG, DE и GE. Если две последовательные буквы поменять местами, как в «bagde», то меняется только одна биграмма (DG превращается в GD), то есть всего 10 % кода. Поскольку остальные 90 % совпадают, неудивительно, что мы легко можем прочесть «bagde» как «badge». При замене или добавлении несущественных букв – как, например, в «barte» – код меняется сильнее. Количество общих биграмм в цепочке «barte» и слове «badge» составляет всего 30 %, что объясняет отсутствие эффекта прайминга. Инверсия или удаление нескольких букв влияет на код в меньшей степени, чем вставка неподходящих букв. Цепочка «grdn» содержит все биграммы слова «garden», а цепочка «gtrdvn» – меньше половины. Именно устойчивость биграммного кода к частичным удалениям и локальным инверсиям объясняет нашу способность чатить пердложинея, в коротых бвукы песерталвены мсетами.
Еще одно преимущество биграммного кода заключается в том, что он нечувствителен к изменениям местоположения и размера. Даже если мы переместим, увеличим или уменьшим слово «badge», «b» останется слева от буквы «d», а «d» – слева от «e». Другими словами, на биграммы не влияет точное расположение и размер письменного слова. Такая схема кодирования гарантирует инвариантность.
На основании вышеописанных наблюдений Грейнджер и Уитни заключили, что письменные слова кодируются исчерпывающим перечнем составляющих их биграмм. Однако тщательный анализ показывает, что с этим выводом есть несколько проблем. Во-первых, он предполагает, что мы должны легко читать слова, буквы в которых сильно разрежены, даже нерегулярным образом. В самом деле, подобная трансформация сохраняет все биграммы и даже делает порядок букв более очевидным. И все же воспринимать эти цепочки нелегко. Другая загвоздка заключается в том, что список биграмм неоднозначен, поскольку не присваивает уникальный код каждому слову. Например, слова «nana» и «anna» содержат один и тот же набор биграмм: АА, NN, AN и NA. Если бы наша зрительная система обращала внимание только на биграммы, мы бы не могли их различать, зато легко воспринимали бы такие маловероятные комбинации букв, как «naananan», составленные из тех же биграмм, что и слово «anna».
К счастью, на помощь теории Грейнджера и Уитни приходят биологические свойства биграммных нейронов. Биграммный нейрон не может реагировать на свою пару букв независимо от того, где она появляется на сетчатке. Как и у любого другого нейрона, его рецептивное поле ограниченно. Как следствие, биграммный код характеризуется пространственной избирательностью и должен быть воспроизведен в нескольких точках зрительного поля. Например, некоторые биграммные нейроны реагируют на буквенную пару NA в начале слова «nana», но не в конце. Это значит, что в таком случае они не сработают на стимул «anna», поскольку в этом слове буквы «na» выходят за пределы их рецептивных полей. В совокупности биграммные нейроны присваивают каждому слову уникальный код.
Гипотеза локальных детекторов биграмм объясняет, почему увеличение расстояния между буквами приводит к снижению скорости чтения. Так как на каждой последующей ступени зрительной пирамиды рецептивные поля нейронов увеличиваются в два-три раза, биграммные детекторы допускают лишь небольшой пространственный сдвиг составляющих биграмму букв – не больше двух-трех символов (см. рис. 3.9). В силу такого ограничения биграммные нейроны срабатывают только в том случае, если расстояние от первой буквы пары до второй не превышает двух символов. Например, нейрон, кодирующий пару АМ, будет реагировать на слова «ham», «arm» и «atom», но не на слова «alarm» или «atrium».
Отсюда вытекает простой прогноз: при постепенном увеличении расстояния между буквами скорость чтения должна оставаться неизменной при умеренном разреживании, но она резко снизится, как только интервал достигнет двух символов. Фабьен Винкье, Лоран Коэн и я подтвердили это правило экспериментально. Как только расстояние между буквами превышает два символа, распознавание слов перестает быть быстрым и параллельным[259]. Вы можете проверить это на себе. В следующих предложениях интервал между буквами постепенно увеличивается. Биграммные нейроны легко выдерживают интервалы в одну и даже полторы буквы. Однако как только расстояние достигает двух символов, быстрое чтение становится невозможным. Вы словно разучились читать – биграммные нейроны в вашей «буквенной кассе» перестали реагировать!
Нейронное дерево слова
Если биграммные нейроны действительно существуют, какую разновидность нейронного кода логично ожидать на следующей ступени зрительной пирамиды? Соединяя несколько биграмм, нервные клетки, расположенные выше в иерархии, должны реагировать на сложные комбинации букв. Предположительно, их рецептивные поля позволяют им обнаруживать цепочки до пяти букв на родном языке читателя. Какие именно цепочки кодируются в первую очередь, в основном остается предметом спекуляций. В главе 1 мы убедились, что процесс чтения осуществляется по двум параллельным путям – от букв к звуку и от букв к смыслу. Следовательно, зрительные нейроны более высокого порядка должны извлекать последовательности букв, значимые для того или иного маршрута. Одни нейроны будут срабатывать на частые графемы, соответствующие определенным звуковым паттернам, такие как «ough», «ain» или «ing». Другие должны реагировать на короткие служебные слова («but», «then», «have»), корни слов (think-, giv-), префиксы (anti-, pre-) или суффиксы (-ing, – tion, – ese). Именно на этом уровне разумно ожидать кодирования морфем – наименьших языковых единиц, обладающих семантическим значением.
Однако нельзя забывать, что на этой стадии зрительную систему интересует только написание. Все, что она делает, – это обнаруживает частые буквенные цепочки, передающие информацию, необходимую для понимания и произношения. Моя нейронная модель предсказывает, что «псевдоморфемы» – цепочки символов, похожие на корень слова, но