Система и структура языка в свете марксистско-ленинской методологии - Неонила Семеновна Афанасьева
Ясно, что при разработке общей таксономии языков еще не одно поколение лингвистов будет использовать квантитативные методы. И всегда им должны быть близки слова одного из основоположников сравнительного и исторического языкознания Ф. Боппа о том, что исследование родства языков – это орудие проникновения в секреты развития языка.
«При историческом изучении языков, при определении степени родства различных языков речь идет не о том, чтобы установить внешние условия в известных частях грамматики, а выяснить, не обусловлены ли эти различия общими законами и нельзя ли вскрыть те скрытые процессы, посредством которых язык от своего предполагаемого прежнего состояния пришел к своему нынешнему (различия перестают быть различиями, как только устанавливаются законы)» [3, 35].
Можно говорить о возникновении в системе лингвистической и исторической науки особого направления, представители которого развивают теорию и практику дешифровки письменных текстов на базе статистических понятий. Б.В. Сухотин создал свою теоретическую и методическую концепцию лингвистической дешифровки. Алгоритм классификации букв Сухотина, основанный на вычислениях, может также служить примером того, что конечной целью количественных вычислений является получение чисто качественных выводов: результаты работы – чисто качественная классификация букв на гласные и согласные [28].
Некоторые из последних работ В. Ингве посвящены исследованию моделей устройства предложения, которые можно было бы использовать в качестве составной части программы синтеза при машинном переводе. Поскольку подход Ингве ориентирован на машинное использование модели синтеза предложения и описания его синтаксической структуры, то в основе его лежит требование о том, что устройство, порождающее предложения, должно иметь конечную оперативную память. В ходе обсуждения адекватности своей модели (гипотезы глубины) Ингве показал непосредственную связь между структурой дерева предложения и объемом оперативной памяти, который необходим для ее порождения.
Гипотеза глубины состоит в том, что многие из нераскрытых ранее особенностей английского синтаксиса можно понять, если принять во внимание ограничение объема непосредственны памяти человека (мы способны запомнить с одного взгляда и правильно воспроизвести около семи произвольно взятых цифр, слов, наименований; по-видимому, мы можем вспомнить сразу не более семи грамматических или синтаксических ограничений). Синтаксис английского языка располагает множеством средств, чтобы автоматически удерживать высказывание в пределах, диктуемых ограничениями объема памяти, а также обойти эти ограничения для сохранения экспрессии [12].
В. Ингве обобщил свои наблюдения в виде гипотезы о том, что различные языки ведут себя по отношению к глубине одинаковым образом.
«Эта гипотеза, несомненно, имеет значение не только для лингвистики, но и для психологии. Если проверка гипотезы Ингве на других языках даст положительные результаты, то этот механизм порождения предложений нужно будет принять в качестве модели порождения речи человеком – независимо от того, какова окажется роль этого механизма в машинном переводе» [20].
Категории количество – качество – мера представляют собой пример подсистемы диалектики как философской науки. Последняя является сложной системой, состоящей из подсистем взаимно связанных друг с другом категорий. Каждый из аспектов исследования количество – качество – мера, форма – содержание, часть – целое, элемент – структура – система, необходимость – случайность и т.д. дает возможность познать лишь одну из граней предмета. Синтез различных абстрактных методов помогает в какой-то степени разрешить противоречие между односторонностью отдельных методов и необходимостью расширения и углубления научных знаний.
В науке нет абсолютных методов – ограниченность, безусловно, присуща и количественному методу. Она необходима для более детального изучения отдельных сторон явлений. То, что сознательно и временно теряется при количественном подходе, восстанавливается при качественном подходе и синтезе обоих. То, перед чем бессильны количественно-качественные методы, познается в союзе с другими методами, при других подходах к предмету познания.
Особенную роль в усилении влияния количественных методов в разных науках, в частности лингвистике, играют моделирование, системный, структурный, функциональный методы. Каждый из них может быть использован сам по себе, независимо от других. Но более ценным является именно комплексное применение методов, при котором они дополняют друг друга.
Количественный подход играет в языковедении заметную роль. В последнее время область приложения количественного анализа значительно расширилась с использованием математической статистики и теории информации[24], что имело большое значение в становлении новых теоретических лингвистических дисциплин, таких, как структурная лингвистика, инженерная лингвистика, вычислительная лингвистика, и решении прикладных задач, таких, как машинный перевод, информационный поиск и т.д.
Непосредственным стимулом развития комплексных количественных исследований и идей квантитативной лингвистики является область знаний, связанных с моделированием процессов интеллектуальной деятельности и обработкой информации в коммуникационных системах «человек – ЭВМ – человек». Общение человека и электронной вычислительной машины с помощью естественного языка может осуществляться лишь при знании специфики функционирования языка в системе «человек – машина – человек». В память ЭВМ может быть введена модель, которая представляет собой сокращенное формализованное описание естественного языка, – машинный базовый язык.
«Построению машинного базового языка предшествует вероятностно-статистическое описание речи, выявляющее основные элементы и текстообразующие свойства конкретного языка. Это описание осуществляется с помощью последовательного использования различных вероятностно-статистических и информационных моделей все возрастающей сложности» [19, 59].
Начальным этапом этой работы является накопление статистических характеристик языковых единиц на разных уровнях языковой структуры, различные информационные характеристики текста, составление частотных словарей слов и словоформ как простейших вероятностно-статистических моделей текста, которые используются для обучения электронно-вычислительных машин.
Известно, что схема процесса познания состоит в переходе от живого созерцания к абстрактному мышлению, а от него – к практике. Математическое языкознание всегда было связано с практикой. Ценность его методологии заключается в том, что если с помощью квантитативных методов удается раскрыть механизм действия каких-либо структур, то такой механизм будет действовать с автоматической точностью. С теоретической точки зрения это значит, что языковедческая теория получает объективное подтверждение своей истинности и из гипотезы превращается в доказанную теорию. А с практической точки зрения это означает, что научные результаты можно передать машине и получить колоссальную экономию человеческих сил в переводе с языка на язык, в реферировании текстов, в дешифровке письменности и т.д. Интенсивная работа в таких областях, как машинный перевод, моделирование порождающих грамматик, построение программирующих языков