Автоутопия. Будущее машин - Бентли Джон
Распознавание шаблонов на дороге заметно сложнее, ведь нужно учитывать множество факторов в сжатые сроки. Разработка программного обеспечения, которое поможет реагировать на сигналы из окружающей среды, – крайне сложная задача. Наиболее очевидный способ научить автомобиль правильным действиям – так называемое поведенческое клонирование (источником информации выступает опытный водитель). На следующем этапе система практикуется и учится принимать решения самостоятельно, повышая свой уровень вождения. При этом процесс контролирует человек и вмешивается, если что-то идет не так (а это случается часто).
На базовом уровне система способна определить, что дорога свободна, на основе большого объема подобных фотографий. Сопоставив данные, система увеличивает скорость до предустановленного предела. Задача становится сложнее, если на дороге много легковых автомобилей, фур, пешеходов и велосипедистов, а в базе нет готовых действий для этой ситуации. Системе придется угадывать, как поведет себя каждый из участников движения, и реагировать соответственно.
Себастьян Трун считает точное восприятие наиболее сложным аспектом. Он отмечает, что в начале работы над проектом Google по разработке автономных автомобилей модуль восприятия не мог отличить пакет от сбитого ребенка. Как уже было сказано, прогресс есть. На конференции Google I/O в 2018 году беспилотник Waymo продемонстрировал взаимодействие с пешеходом, несшим доску размером с дверь, рабочим, наполовину вылезшим из люка, и даже людьми, одетыми в надувные костюмы динозавров. В каждом случае очертания пешеходов были неясны, но Waymo верно их распознавал.
Существуют проблемы и с системой глубокого обучения. По сути, каждая ситуация, с которой сталкивается система, должна быть ей знакома. В противном случае у нее нет варианта действий. Одна из проблем называется «переобучение». Система начинает устанавливать связь между показателями, которые друг к другу никак не относятся. Это все равно что пытаться угадать число, которое выпадет на кубике, основываясь на его цвете или времени суток. Программа искусственного интеллекта будет продолжать строить гипотезы по поводу выпадающих чисел на базе всех параметров, которые ей доступны.
Проблема усугубляется, когда рассматривается больше факторов. Представим, что я повернул налево. Система может решить, что я поступил так из-за велосипедиста в 200 метрах от меня. К тому же я уже несколько раз делал так в этом районе в это время суток. Я описываю очень схематично, но эти примеры позволят понять сложность обучения ИИ вождению, так как там множество переменных.
Недообучение – обратная проблема. Система ИИ не всегда улавливает нужные связи. К примеру, она может не распознать обочину дороги или не понять, пешеход перед ней или велосипедист, неверно истолковав данные с камеры и лидара. Обычно для борьбы с недообучением в систему загружают новые данные или больше практической информации о взаимосвязи между системой ИИ и реальным миром. В компаниях, занимающихся разработкой беспилотных автомобилей, тысячи сотрудников вручную снабжают изображения тегами с полезной информацией. Такое дополнение нейронных сетей фактическими данными позволяет устранить недообучение.
Другая проблема – обобщение. Если человек знает, как выглядят мышь и песчанка, то без труда скажет, что хомяк находится где-то между ними – еще один млекопитающий грызун. Искусственному интеллекту такая задача кажется сложной. Ему тяжело взять что-то знакомое и на основе этого создать нечто новое, которое при этом обладает смыслом. ИИ или вовсе не распознает новый объект, или выдает постоянно меняющиеся описания. Именно поэтому чат-боты пока плохо поддерживают беседу. Нет ощущения, будто они понимают хоть что-то. Чат-боты просто подбирают более-менее подходящую фразу из тех, что слышали прежде.
Искусственный интеллект в действии. Процессор Nvidia выделяет разноцветной обводкой и другими способами те объекты, которые удалось распознать: машины, пешеходов и велосипедистов.
Эксперты по ИИ считают программное обеспечение беспилотных автомобилей чем-то вроде черного ящика. Входные данные известны. Выходные – тоже. Но как система приходит от одного к другому, остается загадкой. Не вполне понятно, как работают алгоритмы или как «думает» машина. В компании Nvidia попытались визуализировать это с точки зрения автопилота. На изображении, полученном с датчиков автомобиля, они выделили объекты, которые влияют на принятие решений. Результаты обнадеживают: процессор фокусируется на контурах дороги, разметке и припаркованных автомобилях. На то же обращали бы внимание и обычные водители.
«Мы не обучали сеть обращать внимание на эти аспекты напрямую. В этом кардинальное отличие», – написал в блоге Урс Мюллер, главный архитектор ПО для беспилотных автомобилей в Nvidia.
Это не исчерпывающее объяснение принципов, по которым нейронная сеть принимает решения, но с чего-то нужно начинать. Мюллер замечает: «Я не могу объяснить все требования, которые предъявляю автомобилю, но могу показать их, а сеть продемонстрирует, что она усвоила». Некоторые убеждены, что пассажирам следует показывать визуализацию. Так они смогут понять, как думает машина, что повысит доверие к автопилоту.
В дополнение к нейронным сетям программное обеспечение беспилотных автомобилей включает в себя карту в высоком разрешении, которая постоянно обновляется по беспроводной сети. Это трехмерные карты, где информация отображается с точностью до сантиметра (к примеру, при передаче дорожной разметки). Они включают в себя множество слоев, в том числе сведения о ситуации на дороге в реальном времени (сигналы светофора) и «семантические» характеристики (дорожные знаки).
Основные игроки. Кто они?
Широкое распространение беспилотных автомобилей кажется очень близким, но в то же время недосягаемым. Совсем как ховерборд из «Назад в будущее» или устройство, похожее на вавилонскую рыбку из романов Дугласа Адамса, которая моментально переводила с одного языка на другой. В 2015 году Илон Маск поделился прогнозом, по которому Tesla начала бы продавать полностью автономные автомобили к 2018 году. Этого не произошло. Не исполнились и планы компании NuTonomy: руководство хотело запустить в Сингапуре сервис беспилотных такси к 2019 году. Сейчас проводятся эксперименты. General Motors обещала в 2019 году выпустить на рынок полностью автономный серийный автомобиль без руля. На момент написания книги он так и не появился.
В 2015 году Google основала родительскую компанию Alphabet и через год перевела Waymo под ее начало. Многие считают, что Waymo заметно опережает других производителей беспилотных автомобилей. Она выигрывает, к примеру, в вопросах расстояния, которое преодолевает машина без вмешательства водителя-испытателя, когда возникает угроза безопасности. Департамент Калифорнии по регистрации транспортных средств предоставляет наглядную статистику по сконцентрированности технологических компаний и экспериментов с беспилотниками именно в этом штате. В Waymo заявляют, что в среднем в 2018 году их автомобили самостоятельно проехали 17 000 километров по территории штата Калифорния без вмешательства водителя. Общий километраж всех машин достиг 16 миллионов, при этом более 1,5 миллионов километров пришлось на 2018 год.
Авторитетная исследовательская компания Navigant с 2015 года занимается аналитикой в этом секторе. Она учитывает 10 критериев: концепцию; стратегию выхода на рынок; партнеров; производственную стратегию; технологии; продажи; маркетинг и распространение; характеристики продукта; его качество и надежность; линейку продуктов и ее жизнеспособность. Специалисты Navigant тоже считают Waymo лидером отрасли.