Главная Обратная связь

Дисциплины:






Формирование запросов



Успех поиска информации напрямую зависит от того, насколько грамотно вы составили поисковый запрос.

Рассмотрим простой пример. Предположим, вы хотите купить компьютер, но не знаете, какие модификации сегодня существуют и каковы их характеристики. Чтобы получить требуемую информацию можно воспользоваться Интернетом, задав запрос поисковой машине. Если зададим в строке поиска слово «компьютер», то результатом поиска будет более 5 миллионов (!) ссылок. Естественно, среди них есть и страницы, удовлетворяющие нашим требованиям, однако найти их среди такого количества не представляется возможным.

Если же написать «какие модификации компьютеров существуют сегодня», то поисковый сервер предложит вам просмотреть около двухсот страниц, но ни одна из них не будет строго соответствовать запросу. Другими словами, в них встречаются отдельные слова из вашего запроса, но речь может идти совсем не о компьютерах, а, скажем, о существующих модификациях стиральных машин или о количестве компьютеров, имеющихся в наличии на складе какой-то фирмы на этот день.

Вообще с первого раза удачно задать вопрос поисковому серверу получается не всегда. Если запрос короткий и в нем присутствуют только часто употребляемые слова, может быть найдено очень много документов, сотни тысяч и миллионы. Наоборот, если ваш запрос окажется слишком детализированным или в нем будут использованы очень редкие слова, вы увидите сообщение о том, что ресурсов, отвечающих вашему запросу, в базе сервера не найдено.

Постепенное сужение или расширение фокуса поиска через увеличение или уменьшение списка ключевых слов, замена неудачных поисковых терминов на более удачные помогут вам улучшить результаты поиска.

Кроме количества слов важную роль в запросе играет их содержание. Ключевые слова, составляющие поисковый запрос, обычно просто разделяются пробелами. Необходимо помнить, что различные поисковые сервера по-разному интерпретируют это. Некоторые из них отбирают по такому запросу только документы, содержащие все ключевые слова, то есть воспринимают пробел в запросе как логическую связку «и». Некоторые интерпретируют пробел как логическое «или» и ищут документы, содержащие хотя бы одно из ключевых слов.

При формировании поискового запроса большинство серверов позволяют в явном виде указать логические связки, объединяющие ключевые слова, и задать некоторые другие параметры поиска. Логические связки обычно обозначаются с помощью английских слов «AND», «OR», «NOT». На разных поисковых серверах при формировании расширенного поискового запроса используется разный синтаксис – так называемый язык запросов. С помощью языка запроса вы можете указать, какие слова обязательно должны встретиться в документе, каких быть не должно, какие желательны (то есть могут быть, а могут не быть).



Как правило, современные поисковые машины используют при поиске все возможные словоформы использованных слов. То есть, независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка: например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

Обычно на титульной странице поискового сервера присутствует ссылка «Помощь», обратившись по которой пользователь может ознакомиться с правилами поиска и языком запросов, используемых на данном сервере.

Еще один очень важный момент – это выбор подходящего для ваших задач поискового сервера. Если вы ищете какой-либо определенный файл, то лучше воспользоваться специализированным поисковым сервером, который индексирует не Web-страницы, а файловые архивы в Интернете. Примером таких поисковых серверов может служить FTP Search (http://ftpsearch.lycos.com), а для поиска файлов по российским архивам лучше воспользоваться российским аналогом – http://www.filesearch.ru.

Для поиска программного обеспечения используют архивы программного обеспечения, такие как http://www.tucows.com/, http://www.windows95.com, http://www.freeware.ru.

Если Web-страница, которую вы ищете, расположена в русской части Сети, возможно, стоит воспользоваться русскими поисковыми серверами. Они лучше работают с русскоязычными поисковыми запросами, снабжены интерфейсом на русском языке.

В табл. 1 приведен список некоторых наиболее известных поисковых серверов общего назначения. Все эти сервера в настоящее время предлагают и полнотекстовый поиск, и поиск по категориям, сочетая в себе, таким образом, достоинства индексирующего сервера и сервера-каталога.

 

Таблица 1.

Список наиболее популярных поисковых серверов

общего назначения

Англоязычные Русскоязычные
http://www.yahoo.com http://altavista.digital.com http://www.hotbot.com http://www.infoseek.com http://www.northernlight.com http://www.google.com http://www.yandex.ru http://www.rambler.ru http://www.aport.ru http://www.list.ru http://www.ru

 

Поисковые системы состоят из трех частей:

- робот – программа, которая посещает web-серверы, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сервере. Просмотры серверов осуществляются периодически, например раз в месяц, раз в две недели;

- индексные массивы и копии текстов просмотренных страниц, хранящиеся в поисковой системе;

- программа, которая, просматривая в соответствии с запросом пользователя индексные массивы, отбирает и выдает потребителю найденные документы.

В 2000 г. специалисты компаний AltaVista, IBM и Compag исследовали ресурсы и гиперсвязи существующего информационного пространства WWW. Просмотрев с помощью поисковых средств AltaVista свыше 600 млн. web-страниц и 1,5 млрд. ссылок, размещенных на этих страницах, они пришли к выводу, что исследуемое пространство состоит из следующих компонентов:

- центральное ядро – тесно связанные между собой web-страницы, с каждой из которых можно попасть на любую другую (27%);

- отправные страницы – в них могут быть ссылки, ведущие к ядру, но из ядра к отправным страницам попасть нельзя (22%);

- конечные Web-страницы, к которым можно прийти по ссылкам из ядра, но к ядру от них попасть нельзя (22%);

- полностью изолированные от центрального ядра страницы (22%);

- web-страницы, не пересекающиеся с остальными ресурсами Интернета (7%).

Информационные ресурсы Интернета делятся на «видимую» и «невидимую» части сайтов. «Видимая» часть сайтов – это та часть, которая обрабатывается поисковыми системами и индексируется. «Невидимая» – часть сайтов, которая не предназначена для обработки поисковыми системами.

Перечисленные особенности информационных ресурсов Интернета и поисковых средств позволяют сделать вывод о том, что эффективность поиска информации в Интернете существенно уступает эффективности поиска в документальных информационно-поисковых системах, использующих специальные информационно-поисковые языки, и эффективности поиска в профессиональных базах. Указанные обстоятельства определяют высокие требования к профессиональной подготовке пользователя, которая необходима для получения нужной информации из информационных ресурсов Интернета.

Наилучшим вариантом работы с информационными ресурсами Интернета является вариант, когда пользователь знает адрес сайта и получает возможность ознакомиться с его содержимым. Адрес сайта может быть получен из различных справочников, например из «Желтых страниц» Интернета, рекламных материалов и других источников. На сайт можно прийти по гиперссылкам, просматривая другие сайты.

Опытный специалист в области информации всегда будет иметь список, каталог адресов самых важных для ведения бизнеса фирмы сайтов.

- Если пользователь ищет информацию среди ресурсов, которые он еще не освоил, одним из основных методов является использование поисковых машин и каталогов.





sdamzavas.net - 2017 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...