Сценарии будущего. Как жить и работать в мире, захваченном нейросетью и роботами - Руслан Геннадьевич Юсуфов
Алгоритмы сегодня работают таким образом, что если мы уже приняли какую-то точку зрения, то нас не станут переубеждать, а покажут информацию, которая будет только подтверждать и наши убеждения, и наши заблуждения. Это касается всех вопросов, по которым важно сегодня поспорить: вакцины, запрет абортов, излучение телекоммуникационных вышек или рептилоидное происхождение Марка Цукерберга.
По любой из этих тем вы найдете подтверждение своим мыслям и группу живущих в таком же пузыре людей для общения, взаимных убеждений и заблуждений. Избежать попадания в алгоритмы крайне затруднительно – это требует усилий и специальных технических навыков, причем силы среднестатистического пользователя и владельцев алгоритмов априори неравны: компания Google собирала сведения из браузера Chrome даже в режиме «инкогнито», а компания Avast, обещая приватность, продавала данные клиентов своего антивируса рекламодателям.
Для системных размышлений о будущем крайне важно помнить о прошлом. Можно вспомнить, что в 1950-х в США были «черные» и «белые» школы, до 1967 года сохранялся запрет на смешанные браки, а в Великобритании великого криптографа Алана Тьюринга в 1952 году принудили к пожизненной гормональной терапии гомосексуализма в качестве альтернативы тюремному заключению. Мы уже пришли к цифровой сегрегации, при которой доступ к технологиям одним разрешен, а другим запрещен. Чем это отличается от отдельных туалетов для белых и черных, которые были нормой в США еще в середине прошлого века? В ближайшие десятилетия мы можем увидеть такое социальное неравенство, порожденное доступом к технологиям, которое в XX веке было немыслимо.
В истории есть множество примеров деления людей на своих и чужих, черных и белых, первого сорта и остальных, например, со звездой на рукаве. Американцам понадобилось всего 20 лет, чтобы через СМИ и Голливуд в сознании граждан приравнять всех мусульман к террористам, параллельно проведя ряд освободительных демократических бомбардировок.
От тезиса о том, что российскую нефть покупать нельзя (но если ее перепродают через Индию, то можно), а нужно покупать американский сжиженный газ, мы очень быстро дошли до особого статуса Russians, как людей, которым не требуется доступ к знаниям, культуре, спорту, международным платежам или одежде иностранных брендов. Им нельзя свободно путешествовать, например, заезжать в некоторые страны на автомобилях с российскими номерами, а если уж приехали, то запрещено ввозить с собой шампунь или туалетную бумагу.
При желании определенных акторов тезис «русским нельзя ввозить в ЕС шампунь» быстро превращается в «русские – грязные животные, и шампунь им не полагается, потому что так заведено природой и законами Божьими». И эти акторы могут распространить такое понимание мироустройства на сотни миллионов человек, сделав его новой нормальностью. А с гарнитурой дополненной реальности вы даже сможете удалить любого Russian из своего пространства – сегрегация с туалетами для «цветных» обретет безграничные возможности. Russian будет буквально стерт из вашего визуального ряда, причем эта опция может включаться по умолчанию для пользователей из определенных стран. А с глаз долой, как известно, из сердца вон!
Социальные сети научились эффективно помещать нас в информационные пузыри, тогда как искусственный интеллект позволит промывать мозги не за десятилетия или годы, а намного быстрее. Наступит «мертвый интернет», полностью состоящий из активности ботов, которые синтезируют данные, новости, выводы и нормы, искусственно формируя реальности отдельных людей, социальных групп и целых человеческих сообществ.
Мы не хотим опираться на факты, а хотим верить в конспирологические теории! Человек склонен искать сознание там, где его нет, демонизировать и боготворить технологии, защищаться от вышек связи 5G и верить в чипирование вакцинами. Заговоры и мистика гораздо интереснее унылых будней, недаром они сразу всплывают при обсуждении всех проблем и острых вопросов. Только за январь 2023-го количество инцидентов со стрельбой в школах в США превышало число дней, прошедших с начала года, однако со страниц газет не сходила действительно важная тема номер один – китайский разведывательный воздушный шар и связанные с ним вопросы: из какого дробовика его сбивать, как правильно показать кузькину мать Китаю и на сколько необходимо увеличить военный бюджет.
Все эти темы поднимались в «Секретных материалах» еще 30 лет назад. Наше желание верить – гораздо сильнее любых фактов или доводов ученых. Одно из ярких сетевых обсуждений 2023 года касалось чувств, эмоций, страданий и боли, которую якобы испытывают большие языковые модели – ChatGPT или Bing Chat поисковой системы Bing.
Большая языковая модель глубокого обучения – компьютерная программа, обученная на огромных объемах данных. Она предсказывает последовательность слов, опираясь на миллиарды примеров, использованных для ее обучения. Лежащий в основе модели трансформер – это набор нейронных сетей, каждая из которых состоит из кодера и декодера, которые извлекают значения из последовательности текста и соотносят их со словами и фразами. Процесс обучения такой модели включает в себя многократное пропускание через нее больших объемов данных со скрытыми (маскированными) словами и настройку параметров для минимизации разницы между скрытыми словами и теми, которые по прогнозам модели должны быть на их месте.
Добавление входных данных к выходным данным модели и подача их обратно в модель позволяет получать предложения и абзацы слово за словом – именно так ChatGPT или Bing Chat генерируют ответы на запросы пользователя. После обучения на общем корпусе данных модель может подвергаться тонкой настройке (файнтюнингу), например, проведением дополнительных раундов обучения на конкретных типах текстов для освоения особенностей стиля или с помощью обратной связи от человека для закрепления желаемого либо подавления нежелательного поведения. В результате обучения формируются параметры, определяющие поведение модели и ее понимание языка.
Почему такие языковые модели называют «большими»? Насколько они большие? У GPT-2 (2019) было 1,5 млрд параметров, что в 10 раз больше, чем у GPT (2018). Тогда как GPT-3 (2020) обучена на текстовых данных объемом 45 терабайт и имеет 175 млрд параметров, а у GPT-4 (2023) уже 1,76 трлн параметров. Представьте, что каждый параметр – это один элемент огромной головоломки с миллионами, миллиардами или даже триллионами частей, и у каждой новой версии количество параметров растет на несколько порядков.
Совершенно очевидно, что работающая по описанным выше принципам компьютерная программа, способная предсказывать последовательность слов, не может испытывать чувств, эмоций, боли и страданий. Просто ее способность в мгновение ока создавать связный и релевантный запросу текст кажется настолько непостижимой магией, что за ней просто обязано скрываться сознание. Однако эта способность объясняется колоссальной «насмотренностью» современных больших языковых моделей.
Что же вошло в 45 терабайт текстов для