По ту сторону чисел - Татьяна Сергеевна Касаткина
Мы помолчали.
– И я не хочу ставить «3» там, где должно быть «2». И отчисление. Которого больше не существует.
Я вспомнила студента по имени Егор, который учится на специальном машиностроении. Да, Саша, я понимаю, о чем ты.
– По итогам семестра многих уволят. Очень достойных преподавателей пожилого возраста. Старая гвардия больше не нужна. Выполнение плана по статьям важнее. Я решил съездить домой на две недели. Параллельно буду думать, что с работой. Когда вернусь, встретимся на кофе.
Саша подарил мне вазу из лампы накаливания, которую он сделал своими руками, и маленький букет роз, перевязанный жёлтой лентой. Я повесила вазу на карниз для штор, и моя мансарда стала уютнее.
9
Саша работал исследователем данных в новостном агентстве. Над проектом «Экран событий». Целью был анализ новостей за сутки и выделение главные темы. Пока редакторы делали это вручную. Предполагалось, что система облегчит их работу и представит информацию в простом, эстетически приятном виде.
Команда состояла из трёх человек. Java-разработчик Володя собирал новости с сайтов и складывал их в базу, разворачивал параллельные вычисления и обеспечивал связь с отделом системных администраторов. Саше нужно было причесать данные. Убрать все лишнее, и превратить кипу текстов в огромную матрицу нулей и единиц. В основном нулей. Матрица была большая и по-особенному хранилась в памяти. К счастью, Саше не нужно было об этом думать. Все написано до нас разработчиками Python. Дальше надо было скормить разреженную матрицу одному из алгоритмов машинного обучения. И все. Делов-то.
Web-разработчик Влад превращал выходной поток чисел в небесно-голубые пузырьки свежих историй. Мыльные пузырьки меняли положение, перемешивались друг с другом. Уступали место новым. К каждому пузырьку можно было прочесть описание. Получить список новостей по теме. Время начала и конца публикаций на просторах интернета. Ну и так далее. У менеджера проекта в голове был ещё десяток идей. Но это потом.
Казалось, что работы у Саши на месяц. Ведь все алгоритмы машинного обучения уже реализованы. Их использование заключалось в написании одной строчке кода. Тонкость была в том, что каждый алгоритм содержал параметры. Их нужно было настроить. И здесь начиналось искусство. Или знание высшей математики. Линейной алгебры. Геометрии случая. Лучше было поговорить об этом с Сашей.
Причёсывание данных тоже было небанальным. Сначала Саша использовал весь текст полностью. Тогда в мире творилась неразбериха. Возможно, на этом можно было бы остановиться. Но глядя матрицы, которые на тестах были не такими огромными, Саша понял, что нельзя принимать решение о важности новости, руководствуясь количеством частиц «не» и местоимений «все». Именно они встречались чаще всего. Почитав, что пишут умные люди на stackoverflow, Саша осознал: надо взять только самые важные части речи. Существительные, глаголы. Постойте. А прилагательные? Наречия? Все это ещё предстояло выяснить.
Новый виток понимания наступил, когда Саша читал блог американского путешественника и дата сайнтиста. Интересно, как в человеке могут сочетаться настолько противоположные вещи. Этот талантливый исследователь указывал на важность приведения слов к нормальной форме. Нормальная форма. Ненормальная форма. Как-то звучит обидно. Так дело дошло до стеммига. Выделения корня слова. Кстати процедуры в английском и русском языке сильно различаются. И вообще есть разные техники. То ли упростишь текст до неузнаваемости и потеряешь половину смысла. То ли выберешь лайтовый вариант, а вместе с ним получишь все старые искажения.
А дальше были тесты. Дни. Недели. Месяцы. Базовой библиотеки машинного обучения оказалось недостаточно, и Саша принял решение перейти к построению графа. После чего удалось получить результат, который команда и менеджер признала удовлетворительным. О чем писали больше всего? Конечно, о политике.
Эдуард был необычным руководителем. Он предоставлял свободу и брал на себя административные вопросы. Не было четкого времени и прихода в офис, обеда или совещаний. Сотрудники часто работали из дома. Или приходили к обеду и засиживались до позднего вечера.
Дизайнер интерфейсов Антон купил небольшие настольные светильники в икее. Тот, кто первым приходил в офис, включал все лампы и до конца дня они горели мягкими, сдержанными огоньками. Для каждого, кто бродил в темноте в поисках путей и решений. Члены команды во второй половине дня устраивали шведское фика около капсульной кофемашины. Иногда это случалось и утром. Ближе к вечеру все перемещались кодить на разноцветные пуфики и иногда заказывали пиццу.
В прошлом сценарист компьютерных игр Макс руководил VR-направлением. Сейчас его команда работала над проектом «Вселенная». В виртуальной реальности можно было путешествовать среди планет и астероидов и смотреть на солнце без страха ослепнуть.
– Сегодня я читал статью о том, что алгоритмы машинного обучения ограничивают наше сознание, – с порога заявил Макс.
– И как это понимать, – возмутился Саша.
– Смотри. Возьмём стандартную рекомендалку. Ту, что подбирает фильмы к просмотру, исходя из твоих предыдущих предпочтений. Как тебе объяснить. Есть фильмы, которые ты уже смотрел. Она может предложить только фильмы, похожие на них. Ей неоткуда получить новую информацию.
– А в чем здесь проблема? В этом и заключается смысл. Ты смотришь фильмы, которые тебе нравятся.
– И остаёшься там, где ты есть. Если бы ты поговорил с другом. Или малознакомым человеком, он рассказал бы тебе о совершенно других картинах. В другом жанре. С другой идеей. И ты нашёл бы в нем другое вдохновение.
– Макс, алгоритмы машинного обучения не лишают тебя общения с другом. Или незнакомцем. Уж не знаю, зачем тебе последнее, – хмыкнул Саша.
– И да, и нет. Зачем мне общаться с другом, если больше чем на половину вопросов мы отвечаем друг другу: «погугли». А рекомендалка еще и услужливо предлагает ответы сама.
– Слушай, Макс. В чем твоя проблема? Чем же хороша твоя виртуальная реальность? С каким другом ты будешь обсуждать фильмы, когда будешь наслаждаться VR-порно?
– Пацаны, заканчивайте орать, – вмешался web-разработчик Никита. – Идите обсуждать экзистенциальные вопросы в буфете. Я делаю модельку Сатурна с кольцами из частичек льда и пыли. Она очень крутая. Она рассказывает людям, как устроен мир. А вы мне мешаете.
– Правда, Саша, пойдём выпьем кофе. Я досмотрел сериал про Альберта Эйнштейна.
– Ничего себе. Я думал, ты всегда будешь занят переездом на новую квартиру. Пойдём. Не будем мешать Никите.
10
Команда показала «Экран событий» менеджеру, двум редакторам и генеральному директору агентства. Впечатление было положительным, и директор предложил Эдуарду представить проект на международном форуме информационных технологий в Сочи. До выступления оставался месяц.
Через несколько дней в лабораторию зашёл редактор. Он два дня тестировал систему и пришёл к выводу, что на общую картину происшествия попадают с заметным опозданием. Например, об обрушении дома в Магнитогорске