Алексей Кутовенко - Профессиональный поиск в Интернете
Основные режимы работы WebResearch – захват контента во время просмотра веб-страниц и последующая работа с архивом. Для сохранения информации штатным режимом является работа WebResearch в связке с браузером Internet Explorer. Также возможна совместная работа с Opera и Firefox – для последнего предлагается соответствующий плагин.
Наиболее функциональна панель инструментов для Internet Explorer. Она состоит из двух частей: Web Research Toolbar и Web Editing Toolbar. Первая повторяет панель для Firefox, а вторая позволяет переключиться в режим редактирования сохраняемой веб-страницы. В данном режиме можно изменять шрифты, помечать важные места цветным маркером, менять форматирование текста, удалять со страницы ненужные элементы. Такой редактор удобен, если вы планируете использовать контент сохраненных страниц в своих документах, и серьезно экономит время при написании текстов на основе сетевых источников. Панель для Firefox предлагает только опции сохранения страницы. В этой части она функционально аналогична панели для Internet Explorer.
Для сохранения веб-страницы предлагается несколько возможностей. Доступно быстрое сохранение страницы одним щелчком на кнопке Save. В этом случае программа не задает никаких вопросов и сохраняет страницу в корневом каталоге своего архива. Если же раскрыть выпадающее меню Save, то доступным станет достаточно подробный перечень команд сохранения. Можно указать конкретный каталог для сохранения документа, присвоить ему одну или несколько тематических категорий, сохранить страницу в ее исходном и нетронутом виде или с выборочным удалением картинок, рекламы, флэш-роликов или скриптов. Полезной опцией является фоновая закачка и сохранение веб-страниц, ссылки на которые содержатся на открытой странице. При необходимости в соответствующем диалоговом окне можно отметить для сохранения только нужные ссылки.
Возможно также сохранение отдельных элементов веб-страниц. Эти операции доступны в контекстных меню браузера при выборе изображений или других объектов и фрагментов текста на открытой веб-странице.
Следующий этап работы с WebResearch – управление архивом собранных материалов. Основная программа-менеджер архива позволяет просматривать сохраненные объекты и управлять коллекцией. При просмотре архива окно WebResearch делится на три части: иерархический список каталогов архива, перечень объектов в активной папке и область просмотра собственно сохраненной веб-страницы. Возможно переключение в полноэкранный режим чтения веб-страницы.
Для сортировки архива используются каталоги, стартовый набор которых по умолчанию создается самой программой. Он включает отдельные папки для вкладок и веб-страниц. Пользователю предлагается дополнять этот список собственными тематическими каталогами. Дополнительный инструмент сортировки – категории-теги, которые предлагается присваивать веб-страницам. Интересно, что в комплект WebResearch уже входит хороший набор категорий, представленный в виде иерархического дерева. Это полезно для начала, однако если учесть отсутствие перевода на русский язык, не так полезно для нас.
Просматривать архив можно как списком, так и мозаикой графических миниатюр, которые генерируются на основе внешнего вида сохраненных страниц WebResearch обладает встроенным планировщиком, который напомнит о необходимости прочтения указанных пользователем документов.
WebResearch обладает хорошим выбором инструментов для работы с сохраненным материалом. Есть система присвоения рейтинга сохраненным документам, возможности добавлять комментарии и править текст веб-страниц.
Система поиска в архиве работает в нескольких режимах: простом, расширенном и «быстром». Наибольший интерес представляет расширенный поиск, который ведется по именам категорий, дате сохранения, типу файла, а также полным текстам документов. При освоении программы полезным будет встроенный мастер составления запросов. Режим «быстрого» поиска предлагает набор готовых шаблонов часто используемых запросов. Кроме того, такие запросы можно сконструировать самостоятельно и сохранить их для последующего использования. Поиск можно вести как во всем архиве, так и в конкретном каталоге. Поддерживается сохранение результатов поиска отдельным самостоятельным списком, пригодным для дальнейшей работы.
WebResearch может импортировать в свой архив уже сохраненные на диске файлы и веб-страницы. Для этого можно воспользоваться диалоговым окном Import. Параметры импорта можно детально настраивать: указывать конкретные файлы для сохранения или же импортировать целые папки своего компьютера. Поддерживается импорт ссылок с указанной веб-страницы или RSS-канала. Импортируемые документы можно сохранять в указанных тематических каталогах WebResearch может также провести автоматическое переименование импортируемых страниц по указанному пользователем шаблону.
Если говорить о возможностях экспорта архива, здесь тоже все на высоте. Документ можно сохранить в виде обычного HTML-фaйла, в форматах MHT и CHM, а также в собственном формате системы, который позволяет обмениваться информацией с другими пользователями WebResearch. В CHM-файл можно экспортировать даже целую подборку веб-страниц, что весьма удобно при экспорте целых сайтов или тематических подборок. Поддерживается экспорт данных в пакет Microsoft Word. Интересна функция создания презентаций, состоящих из слайдов, созданных на основе сохраненных веб-страниц.
Разработчики WebResearch предлагают для своей программы некоторые дополнительные модули, например, предназначенные для совместной работы с Outlook или реализующие совместную сетевую работу нескольких пользователей над одним архивом, а также позволяющие сканировать документы и сохранять их в архиве WebResearch.
Выводы и рекомендации
Расцвет локальных метапоисковых программ пришелся на начало текущего десятилетия. Практически все лучшие приложения в этой области были созданы именно в это время. Последние же годы не внесли в эту сферу новых заметных имен. С точки зрения технологий и, что самое важное, результата поиска русскоязычных ресурсов онлайновые сервисы в настоящее время уверенно превосходят специализированные локальные поисковые программы. Разработчики последних, к сожалению, совсем не спешат развивать сильные стороны своих решений, у которых есть свои козыри и свое пространство для развития. Так что локальный интернет-метапоиск все еще ждет своих героев.
В то же время локальные программы могут быть весьма полезны при решении специфических задач. Проект FirstStop WebSearch интересен кластеризацией и возможностью добавления собственных поисковиков, iMetaSearch – возможностями семантического анализа результатов.
Наиболее функциональным решением для локального метапоиска является пакет Copernic Agent. Несмотря на свои недостатки, он может служить мощным инструментом метапоиска для национальных сегментов интернета и тематических ресурсов. В то же время он плохо подходит для поиска русскоязычных ресурсов, не работает с Google и не дает возможности самостоятельно добавлять новые поисковики. Находящийся в одной «весовой категории» с Copernic Agent пакет aSearch INFO позволяет самостоятельно добавлять поисковики, однако проигрывает Copernic Agent в качестве инструментов анализа и обработки данных.
Сохранение веб-страниц – это одно из обычных действий, совершаемых в ходе веб-поиска, поэтому при серьезной работе с сетевыми источниками предназначенная для этого программа является совершенно обязательным инструментом.
Если у вас нет необходимости обмениваться ссылками и документами по сети, а также если вы работаете преимущественно на одном компьютере, то локальные менеджеры архивов веб-страниц выглядят явно предпочтительней аналогичных онлайновых решений. Из коммерческих программ наиболее привлекательным (особенно благодаря русской локализации) на сегодняшний день решением можно признать пакет Inquiry. Пакет WebResearch предлагает хороший набор инструментов, однако не может похвастаться русскоязычным интерфейсом.
Наиболее доступные средства для решения данной задачи – дополнения для браузеров Лучшие дополнения для Firefox по богатству функциональных возможностей практически не уступают коммерческим пакетам. Для повседневной деятельности лучше подходит менеджер ScrapBook, который располагает всеми основными инструментами для работы с архивом, прост в освоении и поддерживает установку дополнений. Ключевые преимущества Zotero – это возможность подробного описания ресурсов, функция автоматического поиска метаданных для сохраняемых объектов, а также опция генерации библиографических списков. Что касается загрузки метаданных, то для русскоязычных источников данная возможность практически не поддерживается. А вот возможность составления списков литературы будет востребована многими пользователями.
Приложение А
Основные поисковые операторы