Об ИИ без мифов. Путеводитель по истории Искусственного Интеллекта - Черняк Леонид
Первые попытки машинного перевода
С появлением компьютеров у нескольких ученых одновременно возникло желание применить их к автоматизированному переводу с одного естественного языка на другой (Machine Translation, MT). Но задача оказалась сложнее, чем они предполагали, только через полвека, когда MT стал одним из направлений в AI, бесплатные сервисы условно справляются с переводом текстов на уровне, достаточном для ознакомления с содержанием, но делают они это чисто формально и не имеют ничего общего с теми первыми системами.
У задачи МТ есть своя давняя предыстория. В IX веке арабский криптограф Аль-Кинди хотел упростить процесс перевода, он применил методы, которые мы сегодня отнесли бы частотному анализу, теории вероятностей и статистике. В последующем, в XVII–XIX веках предпринимались и теоретические, и даже практические попытки упростить перевод с помощью разного рода механических устройств. За редчайшим исключением все они заканчивались провалом, относительного успеха добился лишь Жорж Арцруни, француз армянского происхождения, эмигрант из России, получивший образование в Санкт-Петербургском университете. Он смог в 30–40-е годы прошлого века создать механизм помогавший переводчику. В СССР механизацией перевода занимался Петр Петрович Смирнов-Троянский (1894–1950), его машина представляла собой фотоаппарат, синхронизированный с печатной машинкой, автор получил на нее патент, но она была слишком сложной и осталась невостребованной.
Первенство в использовании электронного компьютера для MT принадлежит математику Уоррену Уиверу (Warren Weaver, 1894–1978). В 1947 году он выразил свой замысел в форме письма, адресованного Норберту Винеру, а позже в 1949 году оформил его, как тогда было приято, в виде пространного меморандума. В нем Уивер обосновал целый ряд подходов к решению задачи MT, в том числе ориентацию на нейронные сети. Идеи Уивера были приняты, он продолжил исследования в Массачусетском технологическом институте. В начале 50-х им была написана программа MT, работавшая на компьютере SWAC (Standards Western Automatic Computer), одном из двух уникальных компьютеров, разработанных в 1950 году Гарри Хаски (Harry Huskey, 1916–2017) для Национального бюро стандартов США. В 1954 году удалось перевести несколько предложений с русского на английский, но дальше дело не пошло, однако работа стимулировала исследования в области MT.
Более громкую и куда менее заслуженную известность получил другой эксперимент по МТ, известный как Джорджтаунский. Если работа Уивера была глубоким исследованием, то это начинание – ни чем иным, как типичным примером «наивного» MT. Его авторы стремились побыстрее решить актуальную на тот момент задачу – перевод технической документации с русского на английский. В эксперименте участвовали представители IBM и Джорджтаунского университета. А отличие от Уивера авторы пошли к цели в лоб – они загрузили в мэйнфрейм IBM 701 программу, оперировавшую 250 словами и 6 грамматическим правилами. Русские и английские слова и правила хранились на магнитных барабанах, переводимые предложения вводились с перфокарт, а результат выводился на принтер. Алгоритм перевода заключался в формальном подборе маски из английских слов, которая накладывалась на последовательность русских слов. Избранный метод неплохо подходил для перевода тривиальных фраз типа «качество угля определяется калорийностью» транслитерированной в «kachyestvo uglya opryedyelyayetsya kaloryiynostjyu», именно эта фраза почему-то оказалась первой из переведенных. Для более сложных фраз этот метод явно не годился. Если учесть только стоимость IBM 701, составлявшую порядка 1 миллиона долларов того времени, когда автомобиль стоил около 1000, то рациональным все, что было сделано в Джорджтаунском университете, нельзя признать никак. Тем не менее этот эксперимент, невзирая на примитивность по-своему интересен, он остался в истории как редкий для пятидесятых случай применения компьютера не по прямому назначению.
(window.adrunTag = window.adrunTag || []).push({v: 1, el: 'adrun-4-390', c: 4, b: 390})Несмотря на очевидную ограниченность решения, внимание к Джорджтаунскому эксперименту оказалось колоссальным, практически вся американская пресса писала о достигнутом успехе, используя самые восторженные эпитеты. Как только ни называли компьютер IBM: и «машиной-билингвой», и «вундеркиндом-полиглотом», и «электронным мозгом, переводящим с русского». Впрочем, можно предположить, что Джорджтаунский эксперимент потребовался корпорации IBM, скорее всего, для поднятия реноме, она задержалась на старте компьютерной гонки. На первых порах в ней лидировала компания UNISYS, прославившаяся тем, что ее компьютер UNIVAC 1 помог предсказать победу Дуайта Эйзенхауэра на президентских выборах 1952 года. Во многом благодаря рекламе машинного перевода за короткий срок IBM удалось стать монополистом на рынке мэйнфреймов. И еще стоит учесть, что эксперимент с переводом имел явно выраженный политический характер, коммунистическая угроза рассматривалась как вполне реальная со всеми вытекающими выводами.
Логические программы и гипотеза Ньюэлла и Саймона
Аллен Ньюэлл (Allen Newell, 1927–1992) и Герберт Саймон (Herbert Simon, 1916–2001) на несколько лет опередили Минского и Маккарти, попытавшись реализовать еще не названный так символьный подход к AI. Оба, и Ньюэлл, и Саймон именитые ученые, первый признанный авторитет в когнитивной психологии, второй экономист, удостоенный Нобелевской премии. Их объединило общее желание воспроизведение человеческую логику машинными средствами. Оно возникло в начале пятидесятых, когда оба работали в корпорации RAND (Research ANd Development), этом «мыслительном танке», находящемся с 1948 года на службе правительства США и призванном решать стратегически важные концептуальные проблемы. Например, Пол Бэран, работая там, стал автором сетей с коммутацией пакетов, ставший ключом для передачи сообщений в интернете. Под руководством Ньюэлла и Саймона были созданы две работающие программы Logic Theorist (1956) и GPS (General Problem Solver, 1957). По замыслу GPS должна была работать со знаниями, для этого она разделена на две подсистемы: одну можно считать прототипом баз знаний и онтологий, она хранит передаваемые в машину знания, а вторая реализует методы работы с ними. GPS оказалась способной решать некоторые формальные задачи, например головоломку о ханойских башнях, но она не могла справиться с реальными задачами.
О прозрении Ньюэлла, приведшем к работе со знаниями, есть байка, напоминающая легенду о Ньютоне и яблоке. Якобы мысль о возможности представить знания в виде символов пришла ему в голову в момент когда он наблюдал за работой алфавитно-цифрового печатающего устройства (АЦПУ). В АЦПУ, одном из немногих существовавших тогда периферийных устройств, главной деталью был вращающийся барабан, состоящий из одинаковых дисков. На каждом из размещались печатаемые знаки, а между барабаном и бумагой располагалась красящая лента, а под бумагой располагалась линейка, состоящая из молоточков. В тот момент, когда нужная литера на дорожке оказывалась в нужной позиции, по ленте ударял молоточек, она соприкасалась с бумагой, как в пишущей машинке, так за один оборот барабана печаталась целая строка. В 50-е годы еще не было каких-либо графических устройств, поэтому АЦПУ использовали не только для печати текстов, но и для вывода графики в виде мозаики из букв, цифр и других печатных знаков. В порядке развлечения на длинных полосах АЦПУшной бумаги печатали портреты разных персонажей, а на одну страницу прекрасно укладывалась пулька для популярного в те годы преферанса. Сугубо техническое решение, заложенное в печать на АЦПУ, в силу странной аллюзии вызвало у Ньюэлла мысль о возможности по образу и подобию таких вот тривиальных мозаичных картинок создать символьное представление знаний. И что только он мог увидеть в простой как апельсин мозаике из печатных знаков? Но Ньюэлл допустил банальную ошибку – отождествил простой код литеры с тем символом, которым оперирует мозг. Как можно было соотнести простое механическое устройство с мозгом?