Как учится машина. Революция в области нейронных сетей и глубокого обучения - Ян Лекун
Другой вопрос: должен ли ИИ быть на 100 % надежным для введения в эксплуатацию? Не обязательно. Опять же, зачем требовать от ИИ большего, чем от других средств принятия решений? Медицина ежедневно прибегает к обследованиям, надежность которых не идеальна, не подвергая при этом сомнению их полезность. Например, во время обследования всегда присутствует определенная – умеренная – возможность «ложноотрицательных» результатов. Но если возникают сомнения, врач не станет принимать во внимание только один результат обследования. Зачем требовать большего от ИИ?
Мой друг Леон Ботту любит указывать на тот факт, что современное общество производит данные, объем которых растет в геометрической прогрессии – с той же скоростью, что объемы средств для хранения данных или скорость передачи данных в сетях. Но способность людей обрабатывать эту информацию развивается не так быстро. В какой-то момент большая часть человеческих знаний будет извлечена из данных нашими машинами и сохранена ими. Согласно некоторым определениям понятия знания, этот порог уже преодолен.
С другой стороны, когда ИИ используют в судебном, правовом, медицинском, финансовом или административном контексте для принятия решений, которые существенно влияют на отдельных людей, необходимо предоставлять какое-либо обоснование. Если банк использует ИИ для предоставления кредита и отказа в нем, он должен обосновать решение заинтересованному лицу и порекомендовать изменения в его профиле, которые помогут ему получить кредит. С помощью систем машинного обучения легко давать рекомендации, вне зависимости от их важности: применяется анализ чувствительности, который заключается в поиске минимального изменения ввода, которое изменило бы решение. Это тот же принцип, что и в случае негативных примеров, но уже с реальной пользой.
Лучше понять человеческий интеллект?
Развитие ИИ идет рука об руку с развитием нейробиологии. Известно, что устройство зрительной коры головного мозга животных вдохновило ученых на создание архитектуры сверточных сетей. Но можно поступить и наоборот. В течение нескольких лет исследователи нейробиологии использовали сверточную сеть в качестве объяснительной модели работы зрительной коры. Проводятся эксперименты, где изображение параллельно показывают человеку (или животному) и сверточной сети. Активность зрительной коры измеряется функциональной МРТ, магнитоэнцефалографией или электрофизиологическими показателями (у животных), после чего предпринимается попытка предугадать эту активность, исходя из активности, наблюдаемой в сверточной сети. Данные эксперименты подтверждают тот факт, что активность первичной области зрительной коры V1 предугадывается первыми слоями сети, а активность последующих областей в иерархии вентрального пути V2, V4 и IT – верхними слоями сети. Интересное наблюдение! Нейробиология зрения вдохновляет сверточные сети, а сверточные сети, в свою очередь, помогают объяснить работу зрительной коры головного мозга.
Схожие черты этих систем открывают новое поле для исследований как в области нейробиологии, так и в области искусственного интеллекта. Правда, люди и машины учатся по-разному, но разве их методы обучения не имеют общих черт? Индуктивный вывод, заключающийся в определении правила, лежащего в основе последовательности чисел или, в более общем плане, форм, является хорошо известным умственным процессом. Но разве функция, скорректированная в системе обучения, чтобы максимально приблизиться к требуемой задаче, не сродни правилу, позволяющему в компактном виде представить набор исходных данных?
Индуктивный вывод – основа научного метода. Ученый делает наблюдения, пытается их объяснить и выявить основной закон, другими словами, он строит теорию. Затем он оценивает, позволяет ли это предсказывать ему явления, которые он еще не наблюдал. Понаблюдайте за гравитацией! То, что благодаря ей можно предсказать положение планет как сегодня, так и через 100 лет, доказывает обоснованность этого закона.
Обучающаяся машина работает точно так же. Во время своего «обучения» она постепенно выстраивает единую связь – эквивалент компактного представления – между входными данными, которые она собирает, и ожидаемыми от нее результатами. Затем эта связь позволяет ей производить для любого входа правильный выход. Даже если машина не думает, она все равно управляет связями. Она «изучает» понятия кошки, стула или самолета, которые затем позволяют ей идентифицировать любую кошку, стул или самолет. Разве это «понятие» не похоже на определение, когда мы говорим об абстрактных и универсальных представлениях, определяемых различными характеристиками объекта?
Мы можем углубиться в эту аналогию и дальше. В машине на этапе обучения выстраивается взаимосвязь между множеством изображений кошек (входные данные) и понятием кошки (выходными данными). Сконфигурированная модель машины – это стабильное состояние, в котором ошибки распознавания минимальны. Она представляет собой «подход» к понятию кошки.
У людей понятие кошки также является «подходом» к понятию кошки. Эти наблюдения отсылают нас к знакомым философским концепциям, таким как «идеи» Платона и «идеалы» Канта.
Неужели мозг – это всего лишь машина?
На сегодняшний день большинство ученых принимает идею о том, что мозг – это биохимическая машина. Конечно, сложная, но все же машина. Нейрон реагирует электрическим сигналом на свои входы. В зависимости от того, что он получает от своих вышестоящих нейронов, он вычисляет, приводит ли он к электрическому импульсу, потенциалу действия (или «спайку»), который он посылает всем своим нижестоящим нейронам. Механизм этот довольно прост. Но объединив активность миллиардов этих относительно простых нейронов, мы получим человеческий мозг и разум.
Я понимаю, что идея моделирования человеческого мозга может заставить содрогнуться некоторых философов или религиозных людей. Но многие из нас, ученых, считают, что механизмы мышления в конечном итоге будут воспроизводиться системами искусственного интеллекта, способными к обучению.
Те, кто оспаривает это, утверждают, что мы далеки от понимания того, как биологические, физические, квантовые и другие системы объединяются в организме, чтобы заставить мозг работать. Мы и на самом деле не все понимаем, но я убежден, что мозг млекопитающих или людей – это машина, которая умеет «вычислять», и что эти расчеты, в принципе, воспроизводимы электронной машиной – компьютером.
Комплекс человеческого превосходства находится в опасности. Как писал Зигмунд Фрейд, цитируемый выдающимся биологом-эволюционистом Стивеном Джеем Гулдом: «Основные научные