Главная Обратная связь

Дисциплины:






Методы, средства поиска информации



Поиск необходимой информации в Интернете можно осуществлять различными способами:

· Поиск с помощью поисковых машин по ключевому слову

· Поиск с помощью классификаторов поисковых машин

· Каталоги и коллекции ссылок (более общие понятия)

· Рейтинги (самые популярные ресурсы)

· Конференции, чаты

· Страницы ссылок (“Links”) на тематических сайтах (редкие, специализированные вещи)

· Несетевые способы (советы друзей, знакомых; реклама в печатных изданиях)

В начале поиска информации необходимо определить ее тип. Условно можно выделить 4 типа информации.

1 тип — общая (например: история Российской империи),

2 тип — менее общая (например: император Александр II),

3 тип — конкретная (например: реформы Александра II),

4 тип — более конкретная (например: отмена крепостного права).

В зависимости от типа информации определяются и пути поиска.

Информация 1 типа ищется с помощью классификаторов поисковых машин (из российских — рекомендуется Яндекс www.Yandex.ru ). Если сразу сайты с требуемой информацией не находятся, то следует просматривать найденные по классификатору каталоги и страницы ссылок (“Links”), которые находятся сайтах подобной тематике. Эти сайты приводятся в классификаторе по теме и найденных каталогах.

Информация 2 типа ищется подобно поиску для 1 типа, но с преимуществом поиска по каталогам и страницам ссылок.

Информация 3 типа — по ключевым словам, которые вводятся в строку поиска поисковых машин, каталогам, страницам ссылок

Информация 4 типа — по подробным данным, которые вводятся в строку поиска. Данные находятся согласно способам поиска изложенных для 2 и 3 типов.

Примеры:

Поиск по 1 типу. Требуемая информация: «История Российской империи».

Заходим в Яндекс — Наука и образование / Общественные науки / История. По описанию темы находим сайт http://rus-hist.on.ufanet.ru.. Если в нем нет необходимой информации, то переходим на страницу ссылок этого сайта. На ней имеются ссылки на каталоги ресурсов: www.history.ru, http://www.lants.tellur.ru/history/index.htm. В них, скорее всего, будут найдены сайты по на заданную тему.

Поиск по 2 типу. Требуемая информация: «Император Александр II».

Поиск осуществляется аналогично предыдущему, но больше внимания уделяется работе с каталогами www.history.ru, http://www.lants.tellur.ru/history/index.htm .

Поиск по 3 типу. Требуемая информация: «Реформы Александра II»

Здесь появляется новый способ поиска — по ключевым словам. Пишем в строке поиска Яндекса «Реформы Александра II». Результат для просмотра — 1790 страниц, которые находятся на 170 сайтах, в число которых входят и каталоги. Для сужения информации можно добавить новые ключевые слова — дополнительные факты в уже найденном подборе сайтов, например: «1860-1870 гг.» и т. д. В других поисковых машинах набирается полностью «Реформы Александра II в 1860-1870 гг.». Для поиска заданной информации можно еще использовать “Links”, которые приводятся на найденных сайтах



 

47)Архитектура WWW. Основные компоненты технологий поиска.

 

HTML, URL, HTTP, CGI

 

Архитектура!

WWW построена по хорошо известной схеме "клиент-сервер".. Программа-клиент выполняет функции интерфейса пользователя и обеспечивает доступ практически ко всем информационным ресурсам Internet. В этом смысле она выходит за обычные рамки работы клиента только с сервером определенного протокола, как это происходит в telnet, например. Отчасти, довольно широко распространенное мнение, что Mosaic или Netscape, которые безусловно являются WWW-клиентами, это просто графический интерфейс в Internet, является отчасти верным. Однако, как уже было отмечено, базовые компоненты WWW-технологии (HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и поэтому мультипротокольные клиенты должны быть отнесены именно к WorldWideWeb, а не к другим информационным технологиям Internet. Фактически, клиент -- это интерпретатор HTML. И как типичный интерпретатор, клиент в зависимости от команд (разметки) выполняет различные функции. В круг этих функций входит не только размещение текста на экране, но обмен информацией с сервером по мере анализа полученного HTML-текст а, что наиболее наглядно происходит при отображении встроенных в текст графических образов. При анализе URL-спецификации или по командам сервера клиент запускает дополнительные внешние программы для работы с документами в форматах, отличных от HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для запуска клиентом программ независимо от типа документа была разработана программа Luncher, но в последнее время гораздо большее распространение получил механизм согласования запускаемых программ через MIME-типы.

Другую часть программного комплекса WWW составляет сервер протокола HTTP, базы данных документов в формате HTML, управляемые сервером, и программное обеспечение, разработанное в стандарте спецификации CGI. До самого последнего времени (до образования Netscape) реально использовалось два HTTP-сервера: сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов расширилось. Появился очень неплохой сервер для MS-Windows и Apachie-сервер для Unix-платформ. Существуют и другие, но два последних можно выделить из соображений доступности использования. Сервер для Windows -- это shareware, но без встроенного самоликвидатора, как в Netscape. Учитывая распространенность персоналок в нашей стране, такое программное обеспечение дает возможность попробовать, что такое WWW. Второй сервер -- это ответ на угрозу коммерциализации. Netscape уже не распространяет свой сервер Netsite свободно и прошел слух, что NCSA-сервер также будет распространяться на коммерческой основе. В результате был разработан Apachie, кот орый по словам его авторов будет freeware, и реализует новые дополнения к протоколу HTTP, связанные с защитой от несанкционированного доступа, которые предложены группой по разработке этого протокола и реализуются практически во всех коммерческих серверах.

База данных HTML-документов -- это часть файловой системы, которая содержит текстовые файлы в формате HTML и связанные с ними графику и другие ресурсы. Особое внимание хотелось бы обратить на документы, содержащие элементы экранных форм. Эти документы реально обеспечивают доступ к внешнему программному обеспечению.

Прикладное программное обеспечение, работающее с сервером, можно разделить на программы-шлюзы и прочие. Шлюзы -- это программы, обеспечивающие взаимодействие сервера с серверами других протоколов, например ftp, или с распределенными на сети серверами Oracle. Прочие программы -- это программы, принимающие данные от сервера и выполняющие какие-либо действия: получение текущей даты, реализацию графических ссылок, доступ к локальным базам данных или просто расчеты.

Завершая обсуждение архитектуры WorldWideWeb хотелось бы еще раз подчеркнуть, что ее компоненты существуют практически для всех типов компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в Internet, может создать свой WWW-сервер, или, по крайней мере, посмотреть информацию с других серверов.

Основные технологии WorldWideWeb

§ язык гипертекстовой разметки документов HTML (HyperTextMarkupLan-guage);

§ универсальный способ адресации ресурсов в сети URL (UniversalResourceLocator);

§ протокол обмена гипертекстовой информацией HTTP (HyperTextTransferProtocol).

§ универсальный интерфейс шлюзов CGI (CommonGatewayInterface).

HTML (от англ. HyperTextMarkupLanguage — «язык разметки гипертекста») — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируется браузерами и отображается в виде документа, в удобной для человека форме.

URL - Единый указатель ресурсов (англ. URL — UniformResourceLocator) — единообразный локатор (определитель местонахождения) ресурса. По-английски «URL» целиком произносится как /ɜː(ɹ)l/, по-русски чаще говорят [у-эр-э́л], [ю-ар-эл] или [урл] (сленг). Ранее назывался UniversalResourceLocator — универсальный локатор ресурса. URL — это стандартизированный способ записи адреса ресурса в сети Интернет.

HTTP (сокр. от англ. HyperTextTransferProtocol — «протокол передачи гипертекста») — протокол прикладного уровня передачи данных (изначально — в виде гипертекстовых документов). Основой HTTP является технология «клиент-сервер», то есть предполагается существование потребителей (клиентов), которые инициируют соединение и посылают запрос, и поставщиков (серверов), которые ожидают соединения для получения запроса, производят необходимые действия и возвращают обратно сообщение с результатом. HTTP в настоящее время повсеместно используется во Всемирной паутине для получения информации с веб-сайтов

CGI (от англ. CommonGatewayInterface — «общий интерфейс шлюза») — стандарт интерфейса, используемого для связи внешней программы с веб-сервером. Программу, которая работает по такому интерфейсу совместно с веб-сервером, принято называть шлюзом, хотя многие предпочитают названия «скрипт» (сценарий) или «CGI-программа».CGI является одним из наиболее распространённых средств создания динамических веб-страниц.

 

 

48)Основы компьютерной коммуникации:Понятие "компьютерная сеть". LAN, WAN, VPN.

 

Компьютерная сеть представляет собой сложный комплекс взаимосвязанных и согласованно функционирующих программных и аппаратных компонентов.

Основным назначением компьютерной сети является:

· -совместное использование информации;

· совместное использование оборудования и ПО;

· централизованное администрирование и обслуживание.

Основные компоненты компьютерной сети:

· - компьютеры (аппаратный слой);

· - коммуникационное оборудование;

· - сетевые операционные системы;

· - сетевые приложения.

Сети отделов используются небольшой группой сотрудников в основном с целью разделения дорогостоящих периферийных устройств, приложений и данных; имеют один-два файловых сервера и не более тридцати пользователей; обычно не разделяются на подсети; создаются на основе какой-либо одной сетевой технологии; могут работать на базе одноранговых сетевых ОС.

Сети кампусов объединяют сети отделов в пределах отдельного здания или одной территории площадью в несколько квадратных километров, при этом глобальные соединения не используются. На уровне сети кампуса возникают проблемы интеграции и управления неоднородным аппаратным и программным обеспечением.

Корпоративные сети объединяют большое количество компьютеров на всех территориях отдельного предприятия. Для корпоративной сети характерны:

· масштабность - тысячи пользовательских компьютеров, сотни серверов, огромные объемы хранимых и передаваемых по линиям связи данных, множество разнообразных приложений;

· высокая степень гетерогенности - типы компьютеров, коммуникационного оборудования, операционных систем и приложений различны;

· использование глобальных связей - сети филиалов соединяются с помощью телекоммуникационных средств, в том числе телефонных каналов, радиоканалов, спутниковой связи.

 

Классифицируя сети по территориальному признаку, различают локальные (LAN), глобальные (WAN) и городские (MAN) сети.

LAN - сосредоточены на территории не более 1-2 км; построены с использованием дорогих высококачественных линий связи, которые позволяют, применяя простые методы передачи данных, достигать высоких скоростей обмена данными порядка 100 Мбит/с. Предоставляемые услуги отличаются широким разнообразием и обычно предусматривают реализацию в режиме on-line.

WAN - объединяют компьютеры, рассредоточенные на расстоянии сотен и тысяч километров. Часто используются уже существующие не очень качественные линии связи. Более низкие, чем в локальных сетях, скорости передачи данных (десятки килобит в секунду) ограничивают набор предоставляемых услуг передачей файлов, преимущественно не в оперативном, а в фоновом режиме, с использованием электронной почты. Для устойчивой передачи дискретных данных применяются более сложные методы и оборудование, чем в локальных сетях.

MAN - занимают промежуточное положение между локальными и глобальными сетями. При достаточно больших расстояниях между узлами (десятки километров) они обладают качественными линиями связи и высокими скоростями обмена, иногда даже более высокими, чем в классических локальных сетях. Как и в случае локальных сетей, при построении MAN уже существующие линии связи не используются, а прокладываются заново.

В зависимости от масштаба производственного подразделения, в пределах которого действует сеть, различают сети отделов, сети кампусов и корпоративные сети.

 

 

49)Язык компьютеров. Передача данных между компьютерами.

 

Для представления данных в сети используются электрические сигналы. Двоичные числа являются последовательностью из нулей и единиц, и при передачи часто принято считать, что отсутствие электрического сигнала в линии означает ноль, а его наличие - единицу. Двоичные с трудом преобразуются в десятичные, и одно из решений этой проблемы использовать 16-тиричный формат, служащий как бы компромиссом между удобностью десятичного и неудобностью двоичного представлений.

Передача данных между компьютерами и прочими устройствами происходит параллельно или последовательно. Большинство персональных компьютеров пользуется параллельным соединением, т.е. данные передаются одновременно по нескольким проводам. При соединении по проводам используются три различных метода, обозначаемые тремя различными терминами. Соединение бывает: симплексное, полудуплексное, дуплексное.

 

50)Типы соединений: дуплексное, симплексное, полудуплексное,

 

О симплексном говорят, когда данные передаются лишь в одном направлении. Полудуплексное соединение позволяет данным перемещаться в обоих направлениях, но в разное время. Дуплексное соединение, это когда данные следуют в обоих направлениях одновременно.

 

51)2 типа переключений соединений: переключение цепей, переключение пакетов.

 

Переключение цепей - создает единое непрерывное соединение между двумя сетевыми устройствами. Переключение цепи позволяет устройствам делить между собой один и тот же коммуникационный канал, однако каждое должно ждать, пока наступит его очередь передавать или принимать данные. Соединение с переключением цепей требует наличие непрерывного канала связи.

Большинство современных сетей, включая интернет, используют переключение пакетов. Программы передачи данных в таких сетях делят данные на кусочки - пакеты. Данные в сети с переключением пакетов могут двигаться различными путями. Данные необязательно следуют одной дорогой. Разрыв одного канала не приведет к потере соединения - данные просто пойдут другим маршрутом. Сети с переключением пакетов имеют множество альтернативных маршрутов для пакетов. Данные перемещаются в обоих направлениях, поэтому каждый пакет должен содержать адрес назначания.

 

52)Топология сетей. Достоинства, недостатки. Шина,

 

Топологие сетей - ее геометрическая форма или физическое расположение компьютеров, кабелей и других компонентов по отношению друг к другу.

1. Звезда - компьютеры подключены к сегментам кабеля, исходящим из одной точки, или концентратора.

2. Кольцо - подключение к кабелю, замкнутому в кольцо.

3. Шина - подключение вдоль одного кабеля.

Звезда:

"+":

- централизованный контроль и управление

- легко модифицировать сеть, добавляя новый компьютер

- выход из строя одного компьютера не влияет на работоспособность сети

"-":

- выход из строя центрального узла выводит из строя всю сеть

Кольцо:

"+":

-все компьютеры имеют общий доступ

- количество пользователей не оказывает значительного влияния на производительность

"-":

- выход из строя одного компьютера может вывести из строя всю сеть

- трудно локализовать возникшие проблемы

- изменение конфигурации сети требует остановки всей сети

Шина:

"+":

- простота построения

- сеть легко расширяется

- экономный расход кабеля

- относительно недорогая и несложная в использовании среда передачи данных

"-":

- при значителтных обьемах трафика уменьшается пропускная способность сети

- трудно локализовать проблемы

- выход из строя кабеля останавливает работу многих пользователей

 

53)Два метода шинного арбитража: обнаружение столкновений, передача маркера. Общие сведения о сетевых взаимодействиях.

 

Шинный арбитраж - процесс, призванный решить проблему столкновений

- устанавливает правила, по которым компьютер узнают, когда линия свободна и можно передавать данные.

Существуют два метода шинного арбитража: обнаружение столкновений и передача маркера.

Обнаружение столкновений - аналогия переход улицы, при обнаружении столкновений - поведение "только после вас". Используется метод - обнаружение столкновений с прослушиванием несущей, сокращенно CSCD.

Системы с передачей маркера - для того, чтобы передать данные, компьютер должен сначала получить разрешение - поймать циркулирующий в сети пакет данных специального вида, называемой маркером. Сеть имеет средства для обнаружения пропажи маркера и сотворения нового. В противном случае пропажа приводила бы к остановке сети. Каждый раз, когда компьютер должен послать сообщение, он ловит и держит маркер у себя. Как только передача закончилась, он посылает маркер в путешествие дальше по сети.

 

54)Классические сервисы в сетях: файловый, печати, сообщений, приложений, БД.

 

Файловый сервис - обеспечивает выполнение задач организации удаленного доступа, совместного использованич, быстрого переноса и тиражирования, резервного копирования файлов. Этот сервис предусматривает наличие централизованных хранилищ файлов, эффективное использование их дисковых систем.

Сервис печати - позволяет пользователям коллективно получать доступ к устрйствам печати через ограниченное количество интерфейсов, разделять дорогостоящее специализированное оборудование печати, устранять ограничения расстряний между компьютером пользователя и устройством печати, организовывать и обрабатывать очереди запросов на печать.

Сервис сообщений - дает возможность организовать обмен сообщениями между пользователями сети, оперируя текстовой, графической, звуковой и видеоинформацией, позволяя не только передавать, но и сохранять все сообщения. В некоторых случаях этот сервис используется компьютерами для извещения пользователей о наступлении каких - либо событий. Электронная почта является одной из реализации сервиса сообщений.

Сервис приложений - предоставляет пользователям возможность совместно применять не только данные, но и вычислительную мощность сервера для выполнения задач. При этом задача пользователя выполняется на процессоре сервера. Сервер приложений имеет специализацию, он оптимизирован для выполнения конкретных задач и должен поддерживать возможности дальнейшего наращивания своей вычислительной мощности.

Сервис баз данных - предназначен для организации централизованного хранения, поиска и обеспечения защиты данных. Этот сервис реализуется серверами баз данных, программно-аппаратными комплексами, оптимизированными для выполнения перечисленных задач, снижения времени доступа пользователя к информации, управления территориальным местоположением информации сети.

 

55)Общие сведения о сетевых устройствах. Модемы: назначение, классификация, принцип работы, стандарты и протоколы.

 

Модем – устройство для передачи данных, преобразующее цифровой сигнал (последовательность битов) в аналоговый сигнал, который затем можно передавать по телефонным линиям.

Сегодня модемы используются для решения широкого класса задач: голосовая почта, факсимильная связь, обмен информации через системы сотовой связи для переносных компьютеров. При помощи соединений (online) можно обмениваться последними новостями, просмотреть карту погоды и многое другое. Однако рост скорости для обычных телефонных линий ограничен и для его дальнейшего повышения следует использовать другие технологии – ISDN или связь через оптические кабели.

Классификация модемов:

  • по типу используемого канала(линий связи): модемы для коммутируемых каналов, для арендованных каналов; модемы комбинируемые;
  • по скорости передачи информации: мало-скоростные модемы (до 14400 бит/сек.), среднескоростные модемы (от 14400 до 28800 бит/сек), высокоскоростные модемы (>28800 бит/сек);
  • по области применения: для передачи данных, факсимильные модемы, комбинированные модемы;
  • по конструктивному исполнению: внутренние модемы, внешние модемы, портативные, групповые.

Как работает модем

Персональный компьютер является цифровым устройством. Большинство своих задач он выполняет, выключая и включая последовательность электронных ключей. Двоичный О соответствует выключенному ключу, а двоичная 1 - включенному. Между этими значениями нет промежуточных состояний. Телефонная система представляет собой аналоговое устройство, разработанное (в то время, когда цифровая электроника не была известна) для передачи звуков и тона человеческого голоса. Эти звуки преобразуются в аналоговый сигнал, т.е. непрерывный электрический ток, который плавно изменяет свою частоту и силу. Его можно изобразить на осциллограмме как волновую линию:

Модем преобразует цифровые данные в аналоговые сигналы путем изменения, или модуляции, частоты электронной волны. Схожий метод используется радиостанциями с частотной модуляцией. На принимающем конце линии телефонной связи модем делает противоположное: он преобразует аналоговые сигналы обратно в цифровые коды. Два термина — модуляция и демодуляция — дали имя модему.

В связи посредством модема используются, по крайней мере, три стандартизованных элемента персонального компьютера — последовательные порты, команды модема и программы коммуникаций. Разнообразие модемов не позволяет дать общую характеристику принципа их работы, но в большинстве своем обсуждаемые здесь операции относятся к программам, использующим модем с набором команд Hayes для 25-контактного последовательного порта.

Программа обслуживания связи посылает напряжение на контакт 20 последовательного порта, к которому подсоединен модем. Этот сигнал отражает готовность источника информации к передаче данных (Data Terminal Ready, DTR). Он сообщает модему, что компьютер включен и готов к передаче данных. В то же самое время ПК обнаруживает напряжение от модема на контакте 6. Этот сигнал (Data Set Ready, DSR) дает знать П К, что модем готов получать данные или команды. При, нормальной связи с модемом до начала остальной цепочки операций" должны пройти оба сигнала.

Используя стандартный язык команд, называемый по имени модемов Hayes, программа обслуживания связи посылает команду к модему через линию передачи данных 2. Команда требует от модема менять трубку», т.е. открыть соединение с телефонной линией. Программа посылает другую команду Hayes, которая заставляет модем выдать тон или импульсы, необходимые для набора определенного номера по телефону. Модем подтверждает получение команды, отвечая ПК по линии 3 приема данных.

Digital Video Interface (здесь и далее DVI) - это спецификация на стандарт высокоскоростной передачи графической информации, не зависящая от способа вывода информации. В основном это спецификация соединения между компьютером и дисплеем, удовлетворяющая текущим требованиям индустрии ПК и пригодная к применению во всех сегментах рынка (рабочие станции, настольные ПК, портативные ПК и т.д.)

При установке связи между двумя компьютерами модемы должны предоставить друг другу информацию о скорости связи, корректировке ошибок и сжатии данных. Для этого и существуют протоколы — стандартизированные алгоритмы работы модема.

Список стандартных протоколов

Стандартные протоколы утверждены Международным телекоммуникационным союзом (ITU).

V.21 Обеспечивает скорость передачи данных 300 бит/с в дуплексном режиме. Допускает также передачу факсимильных сообщений.

V.22Скорость составляет 1200 бит/с в полудуплексном режиме.

V.22bisВторая редакция протокола V.22, отличается увеличенной скоростью 2400 бит/с и допускает дуплексный режим.

V.23Асимметричный протокол 75 бит/с в восходящем (от пользователя) канале и 600 или 1200 бит/с- в нисходящем. В конце 1980-х — начале 1990 множество выпускавшихся тогда нестандартных модемов, использовавших нестандартную, как правило — реализуемую программно модуляцию маркировались как соответствующие стандарту «V.23 mode 2». На практике они не были совместимы между собой, а реальная скорость работы более быстрого канала могла колебаться от 300 до 5600 бит/с. Наиболее известным представителем такого типа модемов являлись модемы Лександ. Модификация протокола V.23 позволяющая менять восходящий и нисходящий канал местами в процессе работы используется во французской компьютерной сети Минитель (фр. Minitel)

V.29 Асимметричный протокол 2400/2400-4800-7200-9600, позволяющий переключать направление, в котором работает более скоростной канал в процессе работы. Является стандартным для факсов, но в модемах большого распространения не получил в связи с более низкой помехоустойчивостью, чем V.32 и рядом проблем с патентами.

V.32Дуплексный режим. скорость 4800 и 9600 бит/с, допускает автоматическую настройку скорости передачи.

V.32bis Расширение V.32 до скорости 14400 бит/с

V.32terboРасширение V.32 до скорости 19200 бит/с, а у USR Courier до 21600 бит/с

V.34Дуплексный протокол, максимальная скорость 28800 бит/с. Может также поддерживать 24000 и 19200 бит/с.

V.34bisДругое название — V.34+. Максимальная скорость 33600 бит/с. Пониженные скорости: 31200, 24000 и 19200 бит/с.

V.42Протокол обнаружения и коррекции ошибок для передачи данных с высокими скоростями.

V.42bisПротокол сжатия данных. Допускает переключение из режима сжатия в прозрачный режим и обратно, причем независимо для каждого направления.

V.44Протокол сжатия данных.

V.70Обеспечивает одновременную передачу голоса и данных.

V.80Протокол видеосвязи. Обеспечивает скорость передачи видео до 10-15 кадров в секунду.

V.90Дуплексный асимметричный высокоскоростной протокол передачи. Скорость в прямом направлении достигает 56000 бит/с, а в обратном — 33600 бит/с.

V.92Самый современный протокол. Скорость в прямом направлении 56000 бит/с, а в обратном — 48600 бит/с.





sdamzavas.net - 2020 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...