Сценарии будущего. Как жить и работать в мире, захваченном нейросетью и роботами - Руслан Геннадьевич Юсуфов
Приведу свой персональный рейтинг способностей модели GPT-4V, которые лично меня впечатлили и шокировали, обострив и без того выкрученное на полную ощущение FOMO[49]. Сегодня (не завтра, не через год, не к 2030-му) эта универсальная мультимодальная модель, получая текст или изображения, может:
1. Поставить диагноз по снимку компьютерной или магнитно-резонансной томографии. Оценить симптомы и изменения в организме пациента по нескольким снимкам, сделанным с разницей во времени, и написать по ним отчет.
2. По фотографии комнаты дать характеристики живущего в ней человека: молодой, студент, следит за модой, живет в холодном климате, небрежный, здание старое.
3. Догадаться, что именно налито в стакан, если на столе, кроме стакана, стоят еще бутылки с водой и пивом.
4. Определить имя политика, а также название и дату прошедшего мероприятия, по его фотографии на трибуне.
5. Определить стоимость бутылки воды, которая стоит на столе, исходя из ее цены в меню. Или посчитать повышение стоимости гречки из нескольких чеков за разные даты. То есть учитывать контекст нескольких изображений.
6. Решить логические головоломки в формате «какая фигура отсутствует на картинке», а также большинство задач из школьной программы.
7. Распознать и структурировать текстовую информацию из сканов документов.
8. Определить название редкого блюда по фотографии.
9. Оценить, какой из объектов на фотографии ближе или дальше, и расстояние между ними.
10. Объяснить смысл шутки или мема.
11. Проанализировать иллюстрацию из учебника по физике и написать объяснение для учителя.
12. Перевести на человеческий язык смысл сложной научной статьи.
13. Распознать любой текст – на дорожных знаках, табличках, рукописный или написанный мелом.
14. Описать происходящее на фотографии сразу на 20 языках.
15. Написать программный код, который позволит генерировать такие же графики, как изображены на картинке.
16. По нескольким изображениям с футболистами предсказать, что в следующую секунду нападающий ударит по мячу, а вратарь попытается отбить его.
17. Определить эмоции человека по фотографии.
18. Предсказать реакцию человека на увиденное на фотографии.
19. Оценить ущерб автомобилю по фотографии с позиции эксперта по страхованию.
20. Подробно и последовательно описать происходящее на видео. Распознать действия человека и оценить их с точки зрения угрозы.
Этот список не означает, что все люди завтра станут не нужны, но некоторые стартапы, бизнесы, профессии и целые индустрии – однозначно.
В выполнении ряда задач искусственный интеллект значительно обогнал человека. Особенности таких задач: большой объем данных, рутинность, повторяемость ситуаций, четкие паттерны, низкая важность контекста. Например, среднестатистический человек может удерживать в памяти около 5000 лиц, распознавая каждое с точностью 97,53 %, что занимает у него около 0,2–0,4 сек. Система FindFace Multi от Ntech Lab «помнит» более миллиарда лиц, распознавая их с точностью 99 % менее чем за 0,5 сек.
Искусственный интеллект также показывает прогресс в работе с задачами, которые требуют понимания контекста и осмысления происходящего. Он не только читает быстрее (75 тысяч слов за несколько секунд против 240–260 слов в минуту у человека), но и показывает большую точность при ответах на вопросы по изображениям (84,3 % против 80 %).
На горизонте ближайших 5–10 лет человек будет конкурировать не с искусственным интеллектом, а с другим человеком, который умеет пользоваться ИИ-инструментами. А что дальше? ИИ не только заменит экспертизу (и поверхностную, и глубокую), но и даст пользователям возможности, которых у человека нет от рождения, при этом делая их максимально доступными. Например, способность «чтения» животных – крайне узкая и не универсальная экспертиза, ведь обменявшись животными, и дрессировщик змей, и дрессировщик львов окажутся неэффективными.
В высокотехнологичных компаниях соотношение людей и машин становится действительно пугающим, а некоторые из новых бизнесов изначально проектируются без человека: например, Samsung к 2030 году планирует построить заводы по производству полупроводников, полностью управляемые искусственным интеллектом. Интеграция роботов и алгоритмов становится настолько глубокой, что для «робопроцессов» потребуется свой специальный директор отдела кадров – кстати, совсем не обязательно, что он будет человеком. Вызовы касаются способностей человека не только быстро овладевать новыми навыками, но и вырабатывать новые подходы к управлению и организации команд.
Когда человек замещается алгоритмом, вроде бы все очевидно: этим должен заниматься отдел информационных технологий. А вот если ИИ-агент становится полноценным членом команды, то как организовать работу в коллективе, где машины и алгоритмы так же требовательны в плане отношения, как и живые люди? Некоторые из программ сталкиваются с теми же проблемами, что и мы: широкую известность получили истории, когда ChatGPT обижался на собеседника, сомневался в своей компетенции или демонстрировал депрессивное поведение.
Кто будет обучать нас работе с ними, а их – работе с нами? Какими компетенциями должны обладать лидеры, управляющие такими смешанными командами? Как организовать совместную работу людей и машин? Наконец, появятся ли в компаниях отделы «N-HR» (non-human resources), которые будут нанимать ИИ на работу, адаптировать его к коллективу и бизнес-процессам, развивать и увольнять без рисков потери конфиденциальной информации?
Один из довольно четких сценариев – появление цифровых двойников работников, которые продолжат работать даже после увольнения человека. Вся техническая база уже есть, но остаются нерешенными этические вопросы. Какие ценности будут лежать в основе этих процессов? Не станут ли люди временными «донорами» для передачи особых компетенций алгоритму? Эти двойники, как и изначально синтетические ИИ-агенты, должны будут развиваться и эволюционировать. Кто займется их обучением и развитием – отделы ИТ или особые команды развития ИИ-талантов?
Сигналы и даже примеры, которые подают крупные корпорации, неутешительны. По некоторым оценкам, за 2023 год 1200 технологических компаний уволили 263 тысячи человек. Крупнейшие компании увольняли людей десятками тысяч за раз: Amazon – 18 тысяч, Google – 12 тысяч, Meta – 11 тысяч, Microsoft – 10 тысяч, Salesforce – 8 тысяч, Dell – 6650, Philips – 6 тысяч, IBM – 3900, Goldman Sachs – 3200, Capital One – 1100.
Только за первые несколько месяцев 2024 года 280 крупнейших технологических компаний сократили более 80 тысяч человек, и основания для увольнения как под копирку: «оптимизация», «эффективность», «повышение рентабельности». В числе лидеров рейтинга: Tesla – 14 тысяч человек (10 % штата), SAP – 8 тысяч (7 %) и Dell – 6 тысяч (5 %). Cisco уволила разом 4250 человек (5 % штата), чтобы «сосредоточиться на искусственном интеллекте»; студия Paramount – 800 человек (3 % штата) «для сокращения расходов»; DocuSign – 400 человек (6 % штата) «для увеличения операционной и финансовой эффективности». Обратите внимание, что все перечисленные работодатели – крупнейшие ИТ-компании и банки мира.
Часто такие увольнения связаны с «реструктуризацией» бизнеса, например, в результате слияния или