Надежда Баловсяк - Реферат, курсовая, диплом на компьютере
9.1. Поиск в Интернете: общие понятия
В первую очередь определимся со средствами поиска информации в Интернете. По принципу организации и использования их можно разделить на поисковые каталоги (справочники, директории) и поисковые машины.
Каталоги веб-страниц
Поисковые каталоги напоминают систематические каталоги обычных библиотек. Каталоги – это электронные справочники, в которых собраны списки адресов интернет-страниц, сгруппированные по определенным признакам, чаще всего – по тематике. Обычно каталоги веб-страниц бывают многоуровневыми, каждая тема в них разбивается на несколько тем более частного характера. Верхний уровень представляет собой общую категорию, например «бизнес», «наука», «искусство», а элементы самого низкого уровня – это ссылки на отдельные страницы и серверы вместе с кратким описанием их содержимого.
Процедура поиска нужного сайта в каталогах состоит в последовательном переходе от одного уровня к другому. Таким образом, последовательно уточняя тематику поиска, можно, продвигаясь по каталогу, дойти до самых нижних ступеней иерархии и получить, наконец, нужный список сайтов. Каталоги чаще всего используются в тех случаях, когда необходимо получить набор сайтов по какой-то определенной проблеме. В каталогах отображены самые популярные ресурсы, относящиеся к одной теме, которые, кроме всего прочего, отсортированы в порядке значимости.
Наиболее популярными и серьезными каталогами считаются следующие: www.mail.ru (list.mail.ru), каталог поисковой системы «Яндекс» (yaca.Яндекс. ru), weblist.ru, www.vsego.ru, www.myweb.ru. Среди англоязычных ресурсов наиболее популярным является каталог Yahoo! (www.yahoo.com). Самым авторитетным в мире каталогом веб-страниц признан открытый каталог dmoz.org.
Главное преимущество поисковых каталогов заключается в том, что информация в них хранится упорядоченно, в соответствии с элементарной логикой.
Примечание
С помощью каталога нецелесообразно проводить поиск информации по узконаправленной тематике: в нем может просто не оказаться нужной рубрики, а на просмотр похожих разделов может уйти много времени.
Однако у поисковых каталогов существует множество недостатков. Например, в них могут отсутствовать некоторые ссылки: из-за того, что редакторы создают каталоги вручную, количество ссылок в них ограничено, более того, самые интересные из них могут не попадать в каталог, так как редакторы физически не успевают их вносить. Как результат – обновление происходит медленно.
Неоднозначность структуры – это еще один явный минус каталожной организации информации (хотя отчасти он нейтрализуется тем, что в каждом крупном каталоге существует своя система поиска).
Поисковые машины
Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих каталогам, и работают немного по-другому. Поиск с помощью поисковых машин происходит намного быстрее, кроме того, такие системы могут искать среди гораздо большего количества сайтов – область поиска в этом случае практически неограниченна.
Принцип действия поисковых машин заключается в постоянном последовательном исследовании всех веб-страниц. Из-за необходимости постоянного обновления информации время от времени машины возвращаются к просмотренным ранее сайтам, чтобы найти и зарегистрировать возникшие там изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой сохраяются просмотренные поисковиком веб-страницы. Там и осуществляется поиск. Эту базу данных наполняют специальные программы-роботы, которые, просматривая сайты, обращают внимание на некоторые дополнительные элементы. Например, на частоту употребления слова на странице, на его выделение, а также количество ссылок на данный документ на других сайтах. Поисковые машины проводят поиск по заданному пользователем поисковому запросу – специальной фразе или набору слов, которые выражают суть того, что нужно найти.
Кроме этого, с каждой веб-страницей связан набор ключевых слов. Эти слова лучше всего описывают ее содержимое. При поиске информации поисковые машины в первую очередь анализируют их совпадение со словами из поискового запроса.
Таким образом, поиск с помощью поисковых машин состоит в просмотре базы данных веб-страниц и розыске тех из них, которые соответствуют запросу.
Примечание
Большинство современных поисковых систем совмещают в себе и тематический каталог, и возможности поисковой машины.
Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем запустить поиск щелчком на кнопке Найти или Поиск. Система произведет поиск и выдаст результаты в окне браузера. Однако несмотря на общие принципы работы и похожий интерфейс, поисковые машины отличаются между собой целым рядом параметров. Среди них – релевантность результатов, величина и частота обновления баз данных, скорость выдачи результатов и удобство работы.
Наряду с этим существуют и другие различия – языки запроса, зоны поиска, глубина поиска внутри документов, методы определения приоритетов, поэтому применение разных поисковых машин дает различные результаты.
Наиболее популярными поисковыми машинами являются следующие: www.yandex.ru, www.rambler.ru, www.google.com, www.aport.ru, www.mail.ru, www.alltheweb.com, www.yahoo.com, www.lycos.com.
За время существования поисковых машин выработался определенный стандарт предоставления пользователю страницы с результатами поиска. Поэтому, разобравшись в форме выдачи результатов хотя бы одной поисковой машины, можно уверенно пользоваться остальными.
Страница с результатами поиска, полученными с помощью поисковой машины, содержит следующие элементы:
• заголовок найденной страницы;
• цитату из текста страницы, по которой видно, в каком контексте используются слова поискового запроса; искомые слова в цитате, как правило, выделены полужирным шрифтом или отличаются по цвету от основного текста;
• полный адрес страницы;
• размер страницы, дату последнего изменения.
В некоторых случаях в списке ссылок доступна возможность просмотра похожих документов. Отдельные поисковики анализируют содержание найденных по запросу страниц и группируют их по своим особым, внутренним критериям. Например, по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов.
Кроме того, в некоторых случаях в результатах поиска можно увидеть рубрику веб-каталога, к которой относится найденный сайт (если последний участвует в каталоге или рейтинге).
Секреты поиска: построение поискового запроса
Поисковая машина генерирует список документов, релевантных запросу пользователя. Если запрос не выражает то, что нужно найти, – соответственно, результаты поиска будут не те, которых вы ожидали.
Поэтому для эффективного поиска, в первую очередь, необходимо правильно сформулировать поисковый запрос. Его составляют так, чтобы область поиска была максимально конкретизирована и сужена. В запрос следует включать несколько ключевых слов, наиболее полно раскрывающих суть предмета, информацию о котором вы ищете.
Примечание
Основную смысловую нагрузку в поисковом запросе несут имена существительные, гораздо реже нужны прилагательные, а использовать в поисковом запросе глаголы практически бесполезно.
Если в результате вы получите наиболее релевантные ссылки в верхней части списка, то можно считать, что поиск был произведен успешно.
Примечание
Не следует составлять слишком сложный запрос, так как в результате может быть не найдено ни одного документа. Оптимальным результатом поиска является 10–20 ссылок, среди которых можно быстро отыскать две-три нужные.
При поступлении запроса от пользователя поисковая машина просматривает всю проиндексированную информацию и выдает соответствующий список документов. Поисковые механизмы на первом месте располагают документы, которые содержат максимум слов из вашего запроса. Найденные ссылки сортируются в зависимости от месторасположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления. Таким образом, в верхней части списка, полученного с помощью поисковой машины, размещены ссылки на сайты, в которых искомые слова встречаются чаще всего. Поэтому основная задача пользователя во время поиска в Интернете – получить список ссылок, которые максимально соответствуют поисковому запросу.
Чрезвычайно важно при поиске информации в Интернете – как можно больше сузить область поиска. Найти нужные сайты возможно только в том случае, если пользователь сумел подобрать в поисковом запросе именно те слова, которые действительно несут основную смысловую нагрузку.