Главная » SQL, Базы данных » World Wide Web и XML

0

Термины Web и Internet часто используются так, как если бы они были взаимозаменяемыми, но, строго говоря, они обозначают разные понятия.  Различия между ними можно охарактеризовать следующим образом: Web — это гигантская база данных (хотя она и не спроектирована в соответствии с общепринятыми принципами создания баз данных), a Internet — это столь же гигантская сеть, по которой распределена эта база данных.

Примечание. Как должно быть известно читателю, доступ к Web — это не единственная услуга, предоставляемая в Internet; в этой сети можно пользоваться  программами чтения  новостей,  средствами  мгновенной  передачи сообщений,  электронной  почтой, протоколами ftp, telnet и т.д., но в данной главе нас интересует именно Web. В задачу настоящей книги не входит изложение подробных сведений о программах чтения новостей, средствах мгновенной передачи сообщений и других службах.

Сеть Internet развилась из сети Arpanet, которая была создана по проекту, разработанному в конце 1960-х годов под руководством агентства DARPA (Department of Defense Advanced  Research  Projects  Agency—  Управление  перспективных   исследовательских программ) Министерства обороны США для соединения всех разнообразных существовавших в то время правительственных и академических сетей США в единую "суперсеть" с общим протоколом связи, называемым TCP/IP (Transmission Control Protocol/Internet Protocol — протокол управления передачей/межсетевой протокол). Но сеть Internet как таковая (т.е. до развертывания Web) еще не была интегрирована в той степени, в какой могла бы быть; пользователям все еще приходилось использовать для доступа к информации целый ряд различных механизмов: протоколы ftp, gopher, archie,  всевозможные разновидности электронной почты и т.д. Например, если требовалось перейти по ссылке, обнаруженной в каком-то документе, то для этого, как правило, приходилось выполнять следующие действия: отыскивать имя соответствующего файла с помощью электронной почты или системы досок объявлений, регистрироваться на сервере archie по протоколу telnet для определения местонахождения этого файла, регистрироваться в той системе, где хранился файл, с помощью протокола ftp, переходить в соответствующий каталог в этой системе, копировать файл в свою собственную систему и, наконец, выбирать в своей системе подходящую программу для отображения этого файла.

Система Web была изобретена Тимом Бернерсом-Ли (Tim Berners-Lee) в 1989—1990

годах в качестве основы для определения упрощенных методов решения всех сложных задач дистанционного доступа к информации [27.2]. Основным понятием Web стал формат гипертекста, предложенный за несколько лет перед этим  Тэдом Нельсоном (Ted Nelson) [27.19]. Гипертекст— это способ структуризации информации, который позволяет включать в текстовые документы информацию о местонахождении других документов и файлов (или компонентов других документов и файлов) с помощью встроенных ссылок. Важный вклад Бернерса-Ли в решение этой задачи состоял в том, что он сумел реализовать операцию перехода по ссылкам в графическом браузере, который мог теперь применяться для интеграции разных видов информации в одном окне; конечный результат состоял в том, что пользователи получили возможность обращаться к любой необходимой им информации и просматривать ее в браузере с помощью одного щелчка мыши, вместо применения всех отдельных команд и процедур, которые они были вынуждены использовать  раньше.  Бернерс-Ли  сумел  добиться  такого  замечательного  упрощения, определив описанные ниже средства.

■     Механизм идентификации и формирования ссылок на документы и другие ресур сы, получивший название URL (Uniform Resource Locator— унифицированный локатор информационного ресурса). В дальнейшем на его основе было введено обобщенное понятие унифицированного идентификатора информационного ре сурса (Uniform Resource Identifier — URI).

■     Язык HTML (Hypertext Markup Language — язык разметки гипертекста), предна значенный для создания документов и включения в них инструкций, определяю щих способ отображения этих документов.

■     Протокол HTTP (Hypertext Transfer Protocol — протокол передачи гипертекста), с помощью которого может осуществляться передача таких документов по Internet.

Примечание. Дополнительные сведения о языках разметки и HTML приведены в следующем разделе.

Итак, как уже было сказано, Web — это гигантская база данных. Пользователи с помощью Web-браузера обращаются к этой базе данных, распределенной по многочисленным узлам (называемым Web-узлами), каждый из которых имеет  собственный Web-сервер и обозначен своим собственным URL. Каждый узел содержит множество Web-страниц, а каждая страница имеет связанный с ней корневой документ, который обозначает, кроме всего прочего, каким должен быть способ отображения этой страницы. Как и все документы, корневой документ  обычно включает ссылки1  URL на всевозможную дополнительную информацию различных типов (текст, изображения, звуки, видео-информация и т.д.), находящуюся на разных узлах, которая должна быть представлена на странице, но пользователь воспринимает всю эту информацию как единое целое, поскольку  чаще всего пользователя интересует только URL первоначальной страницы (и он  не обязан знать, откуда берется вся остальная информация). Но после вывода  страницы в окно браузера отображаются также содержащиеся в ней ссылки, а после щелчка пользователя

на такой ссылке браузер представляет соответствующую информацию в том же окне (или в новом окне).

Примечание. Некоторые Web-страницы позволяют пользователю запрашивать дополнительные сведения, заполняя формы. Одним из важных частных случаев такого  рода являются машины поиска. Как правило, машина поиска принимает заданный поисковый запрос (например, строку "Camelot") и возвращает список Web-узлов, содержащих

соответствующую информацию. Для того чтобы подобный поиск можно было выполнять за достаточно короткое время, в машине поиска используется всеобъемлющие индексы ключевых слов, которые присутствуют в миллионах  документов, хранящихся в Web. Такие индексы создаются и поддерживаются  так называемыми "Web-навигаторами"

(Web crawler), которые непрерывно работают в Web, осуществляя выборку Web-страниц и регистрируя в своей базе данных возможные параметры поиска для дальнейшего использования.

На каждом конкретном узле информация может храниться в файлах  операционной системы, но все чаще применяется способ хранения такой информации в базах данных (в базах данных SQL и прочих), поэтому Web-серверы должны обладать способностью

взаимодействовать с системами управления базами данных. В разделах 27.6 и 27.7 приведены определенные сведения о том, как может быть организовано такое взаимодействие.

1 Такая дополнительная информация может быть также встроена в саму страницу.

Источник: Дейт К. Дж., Введение в системы баз данных, 8-е издание.: Пер. с англ. — М.: Издательский дом «Вильямс», 2005. — 1328 с.: ил. — Парал. тит. англ.

По теме:

  • Комментарии