Коллектив Авторов - Цифровой журнал «Компьютерра» № 119
...Снуп Догг спускается по лестнице со сцены. Тупак встаёт посередине и опускает голову. Спустя мгновенье сзади него — вспышка; и светящийся силуэт медленно исходит разлетающимися хлопьями. Краткая одиссея с того света закончена.
К оглавлению
Интервью
Дмитрий Комиссаров (РОСА) об открытых исходниках в Сколково
Евгений Крестников
Опубликовано 05 мая 2012 года
Исследовательское подразделение компании РОСА получило статус резидента «Сколково», представив на суд Экспертной коллегии инновационного центра проект разработки «социального» интерфейса. Суть идеи — уйти от ставших стандартными в современных операционных системах окон и создать технологию, отражающую не физическую структуру размещения данных в памяти компьютера, а ассоциативную связь различных информационных объектов по различным признакам, включая их смысловое содержание. О новом проекте компании «Компьютерре» рассказал её руководитель, Дмитрий Комиссаров.
- Насколько было сложно получить статус резидента «Сколково»?
- С формальной точки зрения любой может пройти описанную в документах процедуру и убедить «Сколково» зарегистрировать себя как резидента. На практике дело оказывается несколько сложнее. Например, создавая зарегистрированную в «Сколково» компанию, мы два раза меняли её устав.
- То есть вы создали отдельное юридическое лицо для этой цели?
- Одно из требований «Сколково» — чтобы у юридического лица, которое становится резидентом, из областей деятельности в уставе присутствовали только исследования и разработки. Вы вынуждены создавать отдельную компанию, которая регистрируется в «Сколково». Они преследуют понятную цель, чтобы компания занималась именно исследованиями. Потому что иначе можно взять, например, ИТ-аутсорсера в каком-нибудь банке, зарегистрировать его в «Сколково», всех операционисток банка в эту компанию трудоустроить и начать получать налоговые льготы.
- А что это за компания и как она называется?
- Называется она «РОСА Лаборатори». Это дочерняя компания ЗАО «РОСА», ориентированная на новые технологии, которые мы собираемся разработать и представить рынку.
- По сути, это исследовательское подразделение ЗАО «РОСА»?
- Да, на самом деле это именно так.
- Что может дать компании статус резидента «Сколково»?
- Прежде всего, достаточно большие налоговые льготы. Компания освобождена от налога на прибыль в течение 10 лет или до достижения ею оборота в миллиард рублей. Ключевых моментов два: у вас нет налога на прибыль и у вас сильно сокращены платежи по социальному страхованию. А 80 процентов затрат софтверной компании — это зарплата. То есть вы можете позволить себе нанять гораздо больше людей и использовать их в research, вкладывая те же самые деньги.
- Получается, что статус резидента — это мощное подспорье для российских разработчиков?
- Совершенно верно. Если вы становитесь резидентом, то получаете мощные льготы по основным расходам. Но там есть и вторая возможность — уже будучи резидентом, получать гранты на разработки. Но за это право надо серьёзно побороться. В «Сколково» около четырёхсот компаний-резидентов, а гранты из них получили, по-моему, не более четверти.
- Давайте от общих вопросов перейдём непосредственно к вашему проекту.
- Некоторое время назад, принимая активное участие в жизни Mandriva, мы обнаружили там интересный проект под названием Nepomuk. Как сейчас модно выражаться, семантический десктоп.
- По-моему, это часть среды KDE?
- Да, он входит в KDE, но один из основных разработчиков Nepomuk был внештатным сотрудником Mandriva, и компания достаточно активно занималась этим продуктом. Заложенные в него идеи прекрасны. Обычные интерфейсы сейчас умирают. Пришедший с десктопов интерфейс очень мало связан с информацией, а людей интересует не файловая система сама по себе, а именно информация. Её нужно каким-то образом структурировать и визуализировать.
Идея Nepomuk нас потрясла. Но, во-первых, это проект академический — его двигают люди, которые выступают за чистую науку и красоту кода. К Nepomuk предъявляют множество претензий в части скорости работы. Он медленно работает, потому что написан красиво и все свои внутренние данные хранит в XML. Это, конечно, хорошо, но если у вас проиндексирован, скажем, диск с миллионом текстовых файлов, то чтение индекса займёт соответствующее время, как его ни оптимизируй.
Кроме того, этот семантический десктоп для использования требует серьёзных навыков — у него нет интерфейса, позволяющего простым способом визуализировать возможности. Проблема в том, что проектом занимались академически мыслящие люди, построившие мощную машину, но не подумавшие, как она соотносится с пользователями. Наш интерес состоит в создании интерфейсов нового поколения, которые ориентированы на представление информации. Не на файловую систему, не на документы и даже не на процессы, а именно на информацию.
В дистрибутивах РОСА/Mandriva появился SimpleWelcome, внутри которого есть инструмент TimeFrame — он представляет имеющиеся у пользователя документы в понятной временной шкале. Создать такие надстройки над Nepomuk для визуализации данных — это был первый этап. Мы попробовали, посмотрели на реакцию людей и поняли, что нужно разрабатывать принципиально новое средство. Оно должно представлять информационный срез по хронологической шкале.
К примеру, у меня была вчера активность на компьютере. На этом компьютере я посетил двадцать сайтов, открыл два документа, подготовил один документ, участвовал в чате и разговаривал в Skype с Евгением Крестниковым, написал какие-то сообщения и так далее. Наша задача — представить эту активность в понятном виде. И более того — построить связи между разными видами этой активности.
- Информация визуализируется именно по времени?
- Изначально по времени, но должна быть возможность делать срез любым путём. Если видели такую вещь — Personal Brain, то знаете, что там можно взять за любой узел и просмотреть дерево, как будто этот узел корневой. Здесь задача похожая. То есть я писал вчера какие-то документы, я вхожу в интерфейс и вспоминаю, что мне нужно найти что-нибудь от Крестникова... Смотрю, что я вчера с Крестниковым переписывался, нажимаю на Крестникова и получаю, взявшись за этот узел, всю ассоциированную с вами активность.
Полученные письма, документы и т.д. При этом хотелось бы иметь не только такой срез, но и более продвинутые возможности. Например, индексацию самих документов. Наша задача — создать интерфейс, позволяющий смотреть на информацию с разных сторон. И в идеале хорошо бы не просто смотреть, что я послал письмо Крестникову, но и что в этом письме я писал про интервью. Автоматически выделить ключевые объекты.
Это не совсем наша разработка. ABBYY, например, делает семантическое дерево и такую технологию. Мы самой лингвистикой не занимаемся — задача состоит только в построении интерфейса.
- Какие-то прототипы дизайна интерфейса уже есть? Можно их увидеть?
- Прототипы есть. Но показывать их на этом этапе рано.
- Это будет развитие SimpleWelcome или новый продукт?
- На самом деле всё-таки развитие, потому что мы хотим сделать единообразный интерфейс для различных устройств. С некоторыми, разумеется, изменениями. Понятно, что десктоп не может выглядеть так же, как «таблетка».
- Под развитием я понимал не столько идейное продолжение, сколько наследование кода. Будет ли новый продукт, грубо говоря, следующей версией SimpleWelcome?
- Думаю, да, можно сказать, что это следующая версия SimpleWelcome. Задумки, которые у нас есть, — они в любом случае на несколько лет. Код будет наследоваться.
- А в качестве поискового движка вы используете только Nepomuk?
- Нет, мы будем использовать несколько разных технологий. Хотя в KDE видимо придётся использовать Nepomuk (правда, нам недостаточно его возможностей и скорости работы).
- Проблема со скоростью работы Nepomuk не решается?
- Пока мы не видим, как её можно решить. Там нужно менять архитектуру.
- Будете ли вы использовать наработки в области «интеллектуальных» поисковиков компании Linux Ink.?
- По поводу семантики мы взаимодействуем с Димой Дмитриевым из Linux Ink, который этим занимается. Но не только с ним. Мы видим свою задачу скорее как интерфейсного интегратора, а вот сами семантические технологии будем брать из разных источников.