Анатолий Анисимов - Компьютерная лингвистика для всех - Мифы, Алгоритмы, Язык
Человек придумал электронные устройства, облегчающие арифметический счет. Вскоре обнаружилось, что эти машины можно легко приспособить для решения многих творческих задач, связанных с человеческим знанием. Накапливались факты, писались специальные компьютерные программы, изобретались искусственные языки обработки знаний. Этот процесс привел к становлению новой науки, названной "искусственный интеллект". В наше время многие теоретические исследования по искусственному интеллекту получили практическое применение. Роботы осуществляют точные механические операции, распознают образы, ведут поиск в сложных условиях, сочиняют стихи. В классификации наук США работы по искусственному интеллекту из разряда теоретических переведены в разряд прикладных наук. Одна из главных проблем искусственного интеллекта — компьютерное понимание естественного языка. Эта проблема относится к области компьютерной лингвистики. Компьютерная лингвистика занимается поиском алгоритмов и компьютерной реализацией взаимодействия человека с ЭВМ на естественном человеческом языке. В свою очередь ЭВМ может управлять другими машинными устройствами. Поэтому в случае успешной реализации проектов компьютерной лингвистики человек сможет управлять сложными техническими объектами посредством голосовых команд или текстов на естественном языке. Мир человека, мир слов и мир техники сольются. Сейчас коммерчески доступен большой ряд программных систем взаимодействия на естественном языке с базами данных и экспертными системами. Простое порождение подмножества английского языка для обращения к базам данных было обеспечено одной из ранних американских систем LIFER (Languagе Interface Facility wich Elipsis and Recursion), созданной в 70-е годы. Вслед за ней на компьютерном рынке появились и другие, более гибкие системы, обеспечивающие ограниченный естественно-языковой интерфейс с ЭВМ. В 80-е годы в США образовался ряд компаний, занимающихся разработкой и продажей естественно-языковых интерфейсов с базами данных, экспертными системами. В 1985 г. корпорация «Семантек» представила такой пакет программ QA, компания "Карнеги Группа" предложила аналогичный пакет Language Craft. Ведутся активные работы по созданию систем автоматического перевода. Получила распространение система автоматического перевода SYSTRAN, разработанная под руководством Д. Тома по заказу военно-воздушных сил США. В течение 1974–1975 гг. система была использована аэрокосмической ассоциацией NASA для перевода документов по проекту Аполло — Союз. В наше время она переводит с нескольких языков около 100 000 страниц ежегодно. В Европе работы по созданию компьютерных систем перевода стимулировались образованием Европеиской Инормационной Сети (EURONET DIANA). В 1982 г. Европейское экономическое сообщество объявило о создании европейской программы EUROTRA, цель которой — разработка системы компьютерного перевода для всех европейских языков. Первоначально проект оценивался в 12 млн долларов, в 1987 г. специалисты определили суммарные расходы по этому проекту более чем в 160 млн долларов. В Японии исследования по компьютерной лингвистике концентрируются вокруг общенациональной программы создания компьютеров пятого поколения, объявленной в 1981 г. Существует ряд военных проектов создания человеко-машинных интерфейсов на естественном языке. В США они ведутся в основном в рамках стратегической компьютерной инициативы десятилетней программы, поинятой министерством обороны в 1983 г. Цель ее создание нового поколения «интеллектуальных» оружия и военных систем с целью обеспечить многолетнее технологическое превосходство США. Естественно, что специалисты по искусственному интеллекту, прекрасно разбирающиеся в компьютерах и языках программирования, энергично принялись за решение проблемы понимания языка своими методами. Шел поиск алгоритмов естественного языка. Были созданы сложные программы понимания языка для очень узких специальных областей, реализованы программы частичного машинного перевода и ряд других. Но решающего продвижения в решении проблемы понимания языка так и не было. Язык и человек настолько связаны, что ученым пришлось заняться проблемой понимания мира человеком. А это уже область философии. В разных центрах мира специалисты по компьютерам начали изучать мифологию, труды Платона, Гегеля, Канта, Кьеркегора, Хайдеггера, М. Фуко и многих других классиков философской мысли. Проблема понимания языка машинами привела к вечной теме феномена человека. Кто мы? Откуда мы? Куда идем?
2. МИФЫ
…Это и есть цель и смысл нашего пребывания на земле: мыслить и искать и вслушиваться в дальние исчезнувшие звуки, так как за ними лежит наша истинная родина.
Г. Гессе. Ирис
МИФ КАК СИСТЕМАЧеловек всегда стремился познать истоки своего бытия, пытался понять свой путь, найти начало начал. Почему "в начале было слово", почему по всему миру повторяются сходные предания, почему в этом повторяющемся мире возникают все новые и новые литературные формы и зтому процессу не видно конца. Не одно поколение поэтов, философов, ученых мысленно прокладывало путь назад, в прошлое. Каждый достиг своего предела, но так и не увидел конца. Чем старше человечество, тем в большую бездну времени удается заглянуть. Двигаясь в будущее, мы движемся в прошлое. И нет предела. И вновь мы вступаем на древний путь, рискуя увидеть лишь смутные, забытые, но все-таки — новые тени… В страну мифов открыты ворота, но это и лабиринт, войдя в который, можно всю жизнь блуждать по затерянным тропам прошедшего времени. И все же путь этот манит, как манит странника далекий свет в ночной темноте. Древнегреческие философы много внимания уделяли мифам, ссылаясь на них как на примеры для подтверждения правильности своих систем понимания мира. Аристотель в «Поэтике» одним из первых выделил основные общие схемы построения трагедийных мифов. Он установил законы персонажей мифа ИИИили подобной родству близостью. Аристотель ввел понятие фабулы как линии сюжетного развития. В фабуле трагедий он выделяет три части: перипетия перемена событий к противоположному, узнавание — переход от незнания к знанию, и страдание — действие, причиняющее гибель или боль. Аристотель рассматривает древнегреческие трагедии как поэтическую переработку древних мифов с сохранением их сюжетной линии. Поэтому его анализ структуры трагедий переносится на мифы. В последующие века в научном изучении мифов наступил длительный застой. Но мифы не прекратили своего существования. Они перекочевали в библейские предания, сюжеты картин и народный фольклор. И только в начале нынешнего века наступил переломный момент. Появились исследователи, сумевшие собрать и обобщить огромный фактический материал. Стала проясняться схема представлений древнего человека, зафиксированная в дошедших до нас сказаниях. Английские этнографы Э. Б. Тайлор (1832–1917) и Дж. Фрэзер (1854–1941) проанализировали и классифицировали тысячи мифов, ритуалов и обычаев народов разных стран, В 60-е годы нашего столетия сформировалось научное направление исследования культурных систем, в частности языка, названное структурализмом. В основу его легли новые для того времени методологические приемы исследований: раскрытие системы не только через классификацию ее элементов, но главным образом через установление и изучение отношений элементов, их взаимодействия, инвариантов относительно преобразований. Методы были заимствованы из структурной лингвистики. Смысл имеют не просто звуки или символы языка, а структура их соединений друг с другом. Один из основоположников стуктурного анализа французский ученый К. Леви Стосс, изучив многочисленные мифы племен Южной Америки, пришел к выводу, что их сюжетные схемы отличаются внутренней устойчивостью, не изменяются под влиянием социальных инфраструктур — т. е. мифы отражают схемы мышления первобытного человека. Это дало ему возможность реконструировать некоторые духовные структуры первобытных племен, обнаружить доисторическую логику в действиях древних людей. Стало ясным, что мифы имеют онтологическое значение, в них скрыты базисные структуры мысли. Значительный вклад в мировую структурную мифологию внесли советские ученые Я. Э. Голосовкер, В. Я. Пропп, О. М. Фрейденберг, А. Ф. Лосев, А. А. Тахо-Годи, Е. М. Мелетинский, С. С. Аверинцев. Основной метод, применяемый в мифологических исследованиях, состоит в получении общего факта на основании сопоставительного анализа многочисленных примеров. Чем больше примеров, тем лучше, тем достовернее вывод. Это индуктивный прием. Например, Тайлор обосновал безусловно верный факт одушевления объектов и явлений природы первобытными людьми. Эту особенность мышления он назвал анимизмом (от латинского anima — дух, душа). Ученыи подтверждает свой вывод следующими рассуждениями. Мифы возникли в период дикости, через который прошло все человечество. Значит, в них должна быть зафиксирована информация по интересующему нас вопросу. Надо только выбрать подлинные архаичные предания, отличая их от напластований более позднего времени. Далее идут многочисленные подробные факты, заимствованные из мифов разных народов. Среди примеров: наказание дерева, если с него упал человек; наказание предметов, случайно причинивших боль; брак солнца и луны; пожирание звезд солнцем; пожирание солнца драконом; звезда, говорящая с индейцем; ветер в виде дракона; смерть и чума в виде карающего ангела; превращения людей в животных и т. п. (2) Аналогично размышляли и другие исследователи. Например, Фрэзер проанализировал довольно запутанный древний обряд скрепления клятвы прохождением через части рассеченного тела животных, а иногда и людей. В книге Бытия бог повелел Аврааму разрезать на части домашних животных и птиц, а потом ночью прошел между ними; у греков есть выражение "резать договор", что означает