Петр Ташков - Работа в Интернете. Энциклопедия
Несмотря на заявления многих владельцев поисковых серверов, что запросы могут быть написаны практически на естественном языке, который люди используют для общения между собой, это далеко не так. По всей видимости, еще не скоро наступит время, когда компьютер и человек смогут общаться на естественном (для человека) языке. Впрочем, нужно отдать должное поисковым серверам, в последнее время они стали гораздо лучше понимать пользователя и результаты поиска теперь больше соответствуют ожиданиям, чем это было несколько лет назад. Произошло это во многом благодаря внедрению новых языковых технологий.
Из вышесказанного следует, что на практике рядовому пользователю находить нужную информацию стало проще. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Конечно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов. Теперь расскажу еще о нескольких таких фактах.
Поисковые серверы при обработке запроса не учитывают регистр символов. Поэтому запросы Отдых в Турции и отдых в турции с точки зрения поисковика идентичны.
Также следует помнить, что применять знаки препинания в поисковых запросах вовсе не обязательно, точнее, даже не нужно, так как они также игнорируются поисковыми серверами. Зато многие традиционные знаки препинания могут быть использованы при построении сложных, расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым.
Большинство поисковых серверов (кроме, пожалуй, Google) также игнорирует короткие слова, не несущие смысловой нагрузки. В русском языке это предлоги, союзы и т. д., в иностранных – например, артикли.
Многие поисковые серверы позволяют бороться с опечатками и неправильной раскладкой клавиатуры. Наверняка многим читателям часто случалось набрать при включенной английской раскладке клавиатуры русское слово, и получалось, например, gfhjdjp вместо паровоз. Тот же «Яндекс» сразу определит, что здесь что-то не так, и вверху страницы с результатами поиска выдаст ссылку Быть может, вы искали: паровоз, перейдя по которой можно получить страницу с правильными результатами. Аналогично можно бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой Быть может, вы искали…
Поговорим о том, какие слова лучше взять для запроса поисковому серверу. Во-первых, из интересующей пользователя темы нужно взять самые важные по смыслу слова, отражающие только сущность вопроса. Например, если необходим материал по теме «Ловля пингвинов в Антарктиде в условиях полярной ночи», то вовсе не обязательно писать фразу целиком, результаты поиска в этом случае, скорее всего не устроят запрашивающего, так как будет много лишнего. Есть выражение «Машина должна работать, человек – думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса – выделить ключевые слова, задача поискового сервера – наилучшим образом обработать введенный запрос. В рассматриваемом примере ключевыми можно считать слова ловля пингвинов. Ведь известно, что, кроме Антарктиды, они нигде больше не водятся, ну а «полярную ночь» стоит отбросить хотя бы потому, что в реальности в таких условиях работать достаточно сложно.
Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.
Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах, – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими, в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.
Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:
• выбирайте только самые важные, ключевые слова, касающиеся рассматриваемой темы;
• слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;
• при неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;
• если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.
Надеюсь, что вышеизложенная информация поможет читателям находить в Сети необходимые сведения. Если найти что-то все равно никак не удается, то на помощь придут расширенные методы поиска.
Поисковые запросы: подробно
Для обеспечения более эффективного поиска в Интернете поисковые серверы предоставляют возможность расширенного поиска, а также поиска с использованием языка запросов. Чтобы разграничить эти понятия, приведем их определения. Расширенный поиск – возможность поиска с указанием множества различных параметров. Для этого в поисковиках предусмотрены отдельные страницы, на которых можно задать такие параметры. Принципы работы расширенного поиска схожи у большинства поисковиков.
Язык запросов – система команд, позволяющая изменять параметры запроса из основной строки поиска с помощью специальных команд. Ориентирован на опытных пользователей.
Рассмотрим дополнительные возможности поиска на примерах поисковиков «Яндекс» и Google. Почему именно на них? Потому что «Яндекс» – самый популярный поисковый сервер в русскоязычном Интернете, а Google – самый популярный поисковик в мире. Впрочем, с успехом можно пользоваться и другими поисковыми системами, но мы пока остановимся на двух упомянутых.
Поисковый сервер «Яндекс»
Этот поисковик – один из старейших в русскоязычном сегменте Сети. «Яндекс» появился еще в 1997 году, когда Интернет только начал развиваться на постсоветском пространстве. Постепенно набирая обороты, «Яндекс» сегодня стал самым популярным поисковым сервером в русскоязычном Интернете, его ежедневная аудитория составляет более 4 000 000 человек. Около половины всех русскоязычных пользователей Интернета пользуются его услугами. При поиске в Интернете «Яндекс» одним из первых стал учитывать морфологию русского языка, то есть использовать различные формы слова, о чем говорилось выше.
Зайдя на сайт http://www.yandex.ru, вы можете ввести запрос и тут же получить результаты поиска. Можно также воспользоваться присутствующей там же ссылкой Расширенный поиск и перейти на соответствующую страницу (рис. 5.1), на которой – тонко настроить параметры поиска.
Рис. 5.1. Страница расширенного поиска «Яндекса»
Рассмотрим дополнительные возможности, которые можно использовать на странице расширенного поиска.
В поле Я ищу набираем запрос. Под данным полем расположена надпись (используйте минус перед словом для его исключения), следует взять это на заметку. Такая возможность бывает полезна, когда искомый термин имеет несколько значений. Например, если необходима информация о машине времени (устройстве), то в поле следует указать машина времени – группа , чтобы исключить из результатов поиска сайты, содержащие информацию об одноименном популярном музыкальном коллективе.
В разделе Искомые слова необходимо выбрать расположение слов в тексте сайта. Можно настроить расположение слов относительно друг друга, размещение их на странице, а также форму употребления в тексте. Здесь все ясно из названий, однако поясню, что переключатель употреблены в тексте можно установить в одно из двух положений: в любой форме или точно так, как в запросе. Выбором последнего варианта поисковику указывается, что морфологию слова изменять не нужно, а искать требуется только ту форму слова, которая задана.
В разделе Страницы можно указать параметры искомого документа, настроив значения следующих элементов:
• язык – в данном раскрывающемся списке доступны варианты: любой, русский, английский, французский, немецкий, украинский, белорусский. Повторю, что сайты на иностранных языках искать все же лучше с помощью иностранных поисковых серверов;