Евгений Ющук - Блог. Создать и раскрутить
Поиск в Рамблере
Операторы Рамблера в данном разделе будут рассматриваться в сравнении с операторами Яндекса и Гугла, и на тех из них, что имеют аналоги в двух других поисковых машинах, мы не станем останавливаться слишком подробно. Основные подробности данного раздела касаются именно отличий Рамблера от Яндекса и Гугла.
Еще год назад мы говорили, что Рамблер, на наш взгляд, является третьей по значимости поисковой машиной для работы с русскоязычными текстами. Причем это третье место находилось на очень значительном расстоянии от первых двух. Мы отмечали, что нечасто обращаемся к Рамблеру, поскольку, в зависимости от задачи, обычно начинаем поиск с Яндекса, а затем идем в Гугл, или наоборот – начинаем с Гугла, а затем уточняем результат в Яндексе. На тот момент в большинстве случаев этого было достаточно при работе с каким-то фактическим материалом, когда требовалась не полнота ответа, а правильность.
Сегодня ситуация изменилась. Рамблер, по нашему мнению, ощутимо улучшил свою работу как поисковая машина, а также ввел очень интересный инструмент: стал показывать документы, проиндексированные недавно, т. е. в течение последних нескольких часов. Чтобы воспользоваться этой функцией, надо после получения страницы с результатами поиска по запросу нажать на гиперссылку с данными о найденных страницах, расположенную под поисковой строкой. Она выглядит как число после слова «новых». Вот пример по запросу Спелеолог (число «23» – это гиперссылка, перейдя по которой можно увидеть недавно проиндексированные документы): «Вы искали: Ющук Евгений Леонидович, найдено сайтов: 158, документов: 4436, новых: 23».
Важной особенностью Рамблера является то, что он показывает дату последнего обновления страницы результатов. Например, так: «Обновлено: 26.05.2007 11:25 мск».
Один из ведущих специалистов по автоматизированному поиску информации для целей конкурентной разведки в Интернете Андрей Масалович вообще считает, что наличие перечня последних найденных документов и информации о времени обновления базы – серьезное преимущество, благодаря которому многие специалисты все чаще выбирают Рамблер в качестве поисковика, с которого надо начинать работу по поиску в Интернете (сайт Андрея Масаловича www.tora-centre.ru/).
Кроме того, все, кому приходится заниматься поиском в Интернете профессионально, сходятся во мнении, что только использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос – одна поисковая машина справиться с подобной задачей не способна. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки. Наш опыт подтверждает правильность таких выводов.
В результате нет и не может быть полного совпадения результатов поиска в разных поисковых машинах, особенно когда речь идет о редком запросе.
–
ПРИМЕР
Поиск во всех трех системах точной фразы (фрагмента песни) «Дым, дым в твоих глазах» дал на момент написания статьи такие результаты.
Запрос: [“дым, дым в твоих глазах”]
Результат поиска.
Яндекс: страниц – 0.
Гугл: не найдено ни одного документа, соответствующего запросу “дым, дым в твоих глазах”.
Рамблер: Вы искали: “дым, дым в твоих глазах”, найдено сайтов: 1, документов: 1.
Результат этого поиска можно увидеть здесь: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html
–
Это не значит, что Рамблер лучше всех. Это значит, что нельзя заранее знать, в какой поисковой системе и что именно удастся найти. В этом смысле показателен пример с поиском фразы, также фрагмента редкой песни: «Аэропорт аэропорт ночное зарево огней».
–
ПРИМЕР
Запрос: [“аэропорт аэропорт ночное зарево огней”]
Результат.
Яндекс: страниц – 133, сайтов – не менее 4 http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html
Гугл: 1 – 6 из примерно 32 для “аэропорт аэропорт ночное зарево огней”.
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html
Рамблер: не найдено ни одного документа, полностью соответствующего запросу “аэропорт аэропорт ночное зарево огней”. http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html
–
Итак, перейдем к рассмотрению работы с Рамблером. Основой для этого раздела послужили раздел «Помощь» Рамблера (www.rambler.ru/doc/help.shtml) и форма расширенного поиска (www.rambler.ru/cgi-bin/advanced.cgi?set=www).
Ресурсы, которые Рамблер индексирует. По утверждению самого Рамблера, он индексирует сайты, размещенные в следующих доменах первого уровня:
► Российская Федерация: .ru, .su;
► Украина: .ua;
► Белоруссия: .by
► Казахстан: .kz;
► Киргизия: .kg;
► Узбекистан: .uz;
► Грузия: .ge.
Сайты, находящиеся в других доменах, Рамблер, как он сам утверждает, игнорирует.
Для тех, кто хочет, чтобы сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, этот поисковик оставляет небольшую надежду на успех.
∆ Если Ваш сайт находится вне названных доменов (например, в зонах .com, .org, .net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения[25].
Кроме того, Рамблер утверждает, что умеет извлекать гиперссылки из объектов Macromedia Flash, но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты Рамблера советуют создавать HTML-копию.
Поддержка морфологии слов. Рамблер поддерживает морфологию слов по умолчанию. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки. Мы сейчас не будем останавливаться на всех особенностях использования кавычек, а поговорим о них ниже. Наш эксперимент подтвердил, что Рамблер морфологию слов действительно поддерживает.
Скобки. Как и Яндекс, Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. Этим он ничем не отличается от Яндекса, поэтому подробнее мы применение скобок рассматривать не будем.
Транслитерация. Люди довольно часто делают опечатки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, часто так происходит с буквой «с». Рамблер говорит, что старается исправлять такие опечатки, но не гарантирует результата. Эксперимент показал, что Рамблер действительно справляется с опечатками транслитерации, если их количество в слове невелико. Приведу часть результатов.
–
ПРИМЕР
Запрос 1 (все буквы русские): [“глОКлАя кУздРА”]
Результат поиска.
Вы искали: “глОКлАя кУздРА”, найдено сайтов: 9, документов: 37.
Запрос 2 (заглавные буквы – латинские): [“глOKлAя кYздPA”]
Результат поиска.
Не найдено ни одного документа, полностью соответствующего запросу
“”глOKлAя кYздPA””.
Запрос 3 (заглавные буквы – латинские): [“глOклая куздPа”]
Результат поиска.
Вы искали: “глOклая куздPа”, найдено сайтов: 9, документов: 37.
–
Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в этом случае просто порекомендовал пользователям внимательнее относиться к вводу текста.
Регистр букв. Как правило, Рамблер не учитывает регистр, причем распространяет это правило не только на слова запроса, но и на операторы.
Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.
–
ПРИМЕР
Запрос 1: [“глоклая куздра”]
Результат поиска.
Вы искали: “глоклая куздра”, найдено сайтов: 12, документов: 44.
Запрос 2: [“ГлоКЛаЯ КУздРа”]
Результат поиска.
Вы искали: “ГлоКЛаЯ КУздРа”, найдено сайтов: 12, документов: 44.
–
Однако Рамблер сообщает, что он делает исключение из этого правила, если в запросе два и более слова подряд написаны с заглавной буквы. По его утверждению, он старается искать эти слова также с заглавной буквы. Таким образом, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.
В нашем эксперименте это не подтвердилось. Результаты за про са – как с заглавной, так и с прописной буквы – оказались одинаковыми, и в выдаче присутствовали как релевантные слова, написанные в обоих регистрах.