Kniga-Online.club
» » » » Надежда Баловсяк - Реферат, курсовая, диплом на компьютере

Надежда Баловсяк - Реферат, курсовая, диплом на компьютере

Читать бесплатно Надежда Баловсяк - Реферат, курсовая, диплом на компьютере. Жанр: Программы издательство -, год 2004. Так же читаем полные версии (весь текст) онлайн без регистрации и SMS на сайте kniga-online.club или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.
Перейти на страницу:

9.1. Поиск в Интернете: общие понятия

В первую очередь определимся со средствами поиска информации в Интернете. По принципу организации и использования их можно разделить на поисковые каталоги (справочники, директории) и поисковые машины.

Каталоги веб-страниц

Поисковые каталоги напоминают систематические каталоги обычных библиотек. Каталоги – это электронные справочники, в которых собраны списки адресов интернет-страниц, сгруппированные по определенным признакам, чаще всего – по тематике. Обычно каталоги веб-страниц бывают многоуровневыми, каждая тема в них разбивается на несколько тем более частного характера. Верхний уровень представляет собой общую категорию, например «бизнес», «наука», «искусство», а элементы самого низкого уровня – это ссылки на отдельные страницы и серверы вместе с кратким описанием их содержимого.

Процедура поиска нужного сайта в каталогах состоит в последовательном переходе от одного уровня к другому. Таким образом, последовательно уточняя тематику поиска, можно, продвигаясь по каталогу, дойти до самых нижних ступеней иерархии и получить, наконец, нужный список сайтов. Каталоги чаще всего используются в тех случаях, когда необходимо получить набор сайтов по какой-то определенной проблеме. В каталогах отображены самые популярные ресурсы, относящиеся к одной теме, которые, кроме всего прочего, отсортированы в порядке значимости.

Наиболее популярными и серьезными каталогами считаются следующие: www.mail.ru (list.mail.ru), каталог поисковой системы «Яндекс» (yaca.Яндекс. ru), weblist.ru, www.vsego.ru, www.myweb.ru. Среди англоязычных ресурсов наиболее популярным является каталог Yahoo! (www.yahoo.com). Самым авторитетным в мире каталогом веб-страниц признан открытый каталог dmoz.org.

Главное преимущество поисковых каталогов заключается в том, что информация в них хранится упорядоченно, в соответствии с элементарной логикой.

Примечание

С помощью каталога нецелесообразно проводить поиск информации по узконаправленной тематике: в нем может просто не оказаться нужной рубрики, а на просмотр похожих разделов может уйти много времени.

Однако у поисковых каталогов существует множество недостатков. Например, в них могут отсутствовать некоторые ссылки: из-за того, что редакторы создают каталоги вручную, количество ссылок в них ограничено, более того, самые интересные из них могут не попадать в каталог, так как редакторы физически не успевают их вносить. Как результат – обновление происходит медленно.

Неоднозначность структуры – это еще один явный минус каталожной организации информации (хотя отчасти он нейтрализуется тем, что в каждом крупном каталоге существует своя система поиска).

Поисковые машины

Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих каталогам, и работают немного по-другому. Поиск с помощью поисковых машин происходит намного быстрее, кроме того, такие системы могут искать среди гораздо большего количества сайтов – область поиска в этом случае практически неограниченна.

Принцип действия поисковых машин заключается в постоянном последовательном исследовании всех веб-страниц. Из-за необходимости постоянного обновления информации время от времени машины возвращаются к просмотренным ранее сайтам, чтобы найти и зарегистрировать возникшие там изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой сохраяются просмотренные поисковиком веб-страницы. Там и осуществляется поиск. Эту базу данных наполняют специальные программы-роботы, которые, просматривая сайты, обращают внимание на некоторые дополнительные элементы. Например, на частоту употребления слова на странице, на его выделение, а также количество ссылок на данный документ на других сайтах. Поисковые машины проводят поиск по заданному пользователем поисковому запросу – специальной фразе или набору слов, которые выражают суть того, что нужно найти.

Кроме этого, с каждой веб-страницей связан набор ключевых слов. Эти слова лучше всего описывают ее содержимое. При поиске информации поисковые машины в первую очередь анализируют их совпадение со словами из поискового запроса.

Таким образом, поиск с помощью поисковых машин состоит в просмотре базы данных веб-страниц и розыске тех из них, которые соответствуют запросу.

Примечание

Большинство современных поисковых систем совмещают в себе и тематический каталог, и возможности поисковой машины.

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем запустить поиск щелчком на кнопке Найти или Поиск. Система произведет поиск и выдаст результаты в окне браузера. Однако несмотря на общие принципы работы и похожий интерфейс, поисковые машины отличаются между собой целым рядом параметров. Среди них – релевантность результатов, величина и частота обновления баз данных, скорость выдачи результатов и удобство работы.

Наряду с этим существуют и другие различия – языки запроса, зоны поиска, глубина поиска внутри документов, методы определения приоритетов, поэтому применение разных поисковых машин дает различные результаты.

Наиболее популярными поисковыми машинами являются следующие: www.yandex.ru, www.rambler.ru, www.google.com, www.aport.ru, www.mail.ru, www.alltheweb.com, www.yahoo.com, www.lycos.com.

За время существования поисковых машин выработался определенный стандарт предоставления пользователю страницы с результатами поиска. Поэтому, разобравшись в форме выдачи результатов хотя бы одной поисковой машины, можно уверенно пользоваться остальными.

Страница с результатами поиска, полученными с помощью поисковой машины, содержит следующие элементы:

• заголовок найденной страницы;

• цитату из текста страницы, по которой видно, в каком контексте используются слова поискового запроса; искомые слова в цитате, как правило, выделены полужирным шрифтом или отличаются по цвету от основного текста;

• полный адрес страницы;

• размер страницы, дату последнего изменения.

В некоторых случаях в списке ссылок доступна возможность просмотра похожих документов. Отдельные поисковики анализируют содержание найденных по запросу страниц и группируют их по своим особым, внутренним критериям. Например, по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов.

Кроме того, в некоторых случаях в результатах поиска можно увидеть рубрику веб-каталога, к которой относится найденный сайт (если последний участвует в каталоге или рейтинге).

Секреты поиска: построение поискового запроса

Поисковая машина генерирует список документов, релевантных запросу пользователя. Если запрос не выражает то, что нужно найти, – соответственно, результаты поиска будут не те, которых вы ожидали.

Поэтому для эффективного поиска, в первую очередь, необходимо правильно сформулировать поисковый запрос. Его составляют так, чтобы область поиска была максимально конкретизирована и сужена. В запрос следует включать несколько ключевых слов, наиболее полно раскрывающих суть предмета, информацию о котором вы ищете.

Примечание

Основную смысловую нагрузку в поисковом запросе несут имена существительные, гораздо реже нужны прилагательные, а использовать в поисковом запросе глаголы практически бесполезно.

Если в результате вы получите наиболее релевантные ссылки в верхней части списка, то можно считать, что поиск был произведен успешно.

Примечание

Не следует составлять слишком сложный запрос, так как в результате может быть не найдено ни одного документа. Оптимальным результатом поиска является 10–20 ссылок, среди которых можно быстро отыскать две-три нужные.

При поступлении запроса от пользователя поисковая машина просматривает всю проиндексированную информацию и выдает соответствующий список документов. Поисковые механизмы на первом месте располагают документы, которые содержат максимум слов из вашего запроса. Найденные ссылки сортируются в зависимости от месторасположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления. Таким образом, в верхней части списка, полученного с помощью поисковой машины, размещены ссылки на сайты, в которых искомые слова встречаются чаще всего. Поэтому основная задача пользователя во время поиска в Интернете – получить список ссылок, которые максимально соответствуют поисковому запросу.

Чрезвычайно важно при поиске информации в Интернете – как можно больше сузить область поиска. Найти нужные сайты возможно только в том случае, если пользователь сумел подобрать в поисковом запросе именно те слова, которые действительно несут основную смысловую нагрузку.

Перейти на страницу:

Надежда Баловсяк читать все книги автора по порядку

Надежда Баловсяк - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки kniga-online.club.


Реферат, курсовая, диплом на компьютере отзывы

Отзывы читателей о книге Реферат, курсовая, диплом на компьютере, автор: Надежда Баловсяк. Читайте комментарии и мнения людей о произведении.


Уважаемые читатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

  • 1. Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации.
  • 2. Просьба отказаться от оскорблений, угроз и запугиваний.
  • 3. Просьба отказаться от нецензурной лексики.
  • 4. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор kniga-online.


Прокомментировать
Подтвердите что вы не робот:*
Подтвердите что вы не робот:*