Please enable JavaScript.
Coggle requires JavaScript to display documents.
Управление распределенными данными - Coggle Diagram
Управление распределенными данными
Управление структурированными данными в локальных сетях
Направления развития и средств управления РД
Построение РБД в рамках локальных систем
Усовершенствование методов управления как структурированными, так и неструктурированными данными при увеличении объемов хранимых данных
Увеличение объемов и скоростей вычисления на ресурсах Интернета
Интеграция методов управления структурированными и неструктурированными данными
Распределенная база данных (РБД)
система логически интегрированных и территориально распределенных БД, языковых, программных, технических и организационных средств, предназначенных для создания, ведения и обработки информации
Информация физически хранится на разных ЭВМ, связанных сетью передачи данных
Предпосылки возникновения
Предпосылки возникновения
резкое увеличение объема внешней памяти ПК при ее удешевлении
развитие возможностей ПК
Достоинства
модульная реализация взаимодействия
возможность использования объектно-ориентированного подхода в программировании
возможность распределения файлов в соответствии с их активностью
независимые разработки локальных БД через стандартный интерфейс
соответствие структуры РБД структуре организаций
гибкое взаимодействие локальных БД
снижение стоимости передач
высокие системные характеристики
Проблемы
избыточность, несогласованность данных по времени,
согласование процессов обновления и запросов,
использования телекоммуникационных ресурсов,
учет работы дополнительно подсоединенных локальных БД,
стандартизация общего интерфейса,
усложнение защиты данных.
Правила для РБД
Локальная автономность.
Отсутствие опоры на центральный узел.
Непрерывное функционирование (развитие) РБД.
Независимость РБД от расположения локальных БД.
Независимость от фрагментации данных.
Независимость от репликации (дублирования) данных.
Обработка распределенных запросов.
Обработка распределенных транзакций.
Независимость от типа оборудования.
Независимость от операционной системы.
Независимость от сетевой архитектуры.
Независимость от типа СУБД.
Общий набор(система таблиц) данных
глобальный уровень, который определяется при проектировании теми же методами, что и концептуальная модель централизованной БД
Пользовательский уровень
фрагменты глобального уровня, которые составляют фрагментарный, логический уровень.
локальная логическая модель
После размещения данных каждый узел имеет локальное, узловое представление
Схема работы
Пользовательский запрос поступает в систему управления РБД (СУРБД),
Запрос через сетевую и локальную ОС попадает в локальную СУБД.
Если запрос связан с локальными данными, СУБД осуществляет вызов данных из локальной БД, которые поступают пользователю.
Если часть данных находится в другой локальной БД, локальная СУБД дополнительно через локальные и сетевую ОС осуществляет удаленный вызов процедуры (Remote Procedure Call — PRC),после выполнения которой данные передаются пользователю.
стратегии хранения данных
Централизация
Единственная копия в одном узле
+
Простота структуры
--
скорость обработки ограничена одним узлом
ограниченный доступ
невысокая надежность
объем БД ограничен размером долговременной памяти
Локализация
Единственная копия, расчленение по узлам
полная копия не допускается
+
Объем БД определяется памятью сети;
снижение стоимости РБД;
уменьшение времени отклика;
повышение надежности при высокой локализации.
--
запрос может быть по всем узлам;
ухудшение доступа.
невысокая надежность
Используется тогда, когда необходимо, чтобы объем БД > размера долговременной памяти
Дублирование
+
выше надежность и доступ;
простота восстановления;
локальная асинхронная обработка в узлах;
быстрое получение ответов.
--
объем БД ограничен объемом долговрем. памяти;
необходимость синхронизации;
слабая реализация параллельной обработки
Используется тогда, когда необходима высокая надежность, объем БД невелик, нет частых обновлений, но запросы интенсивны.
Смешанная
Несколько копий хранимого логического фрагмента в каждом узле.
+
любая степень надежности;
большая доступность;
меньше пересылок данных;
параллельная обработка.
--
рост стоимости согласования данных
разная частота обращения узла к различным частям БД
потеря надежность из-за расчленения данных
потеря объемов свободной памяти из-за дублирования данных
Управление неструктурированными данными в локальных сетях
Гипертекстовая система
гипертекстовая БД;
система управления гипертекстом
инструмент интерактивного управления процессами или браузинг
беглый просмотр гипертекстовых документов или гипертекстовой базы данных;
способность человека воспринимать информацию в процессе такого беглого просмотра;
инструмент для создания и ведения гипертекста
Требования
Структурный аспект
Гипертекстовая система должна иметь базу данных из двух составляющих:
а) информационные единицы (ИЕ) или узлы с интересной пользователю информацией;
б) дуги, представляющие структурные и семантические связи узлов.
Функциональный аспект
гипертекстовая система должна иметь
специальные инструментальные средства:
1) средства для поддержки авторской деятельности
2) средства для браузинга в процессе ассоциативной навигации
Визуальный аспект
возможность проводить быстрые, реверсивные операции над ИЕ с немедленно видимыми результатами
Навигация в гиперпространстве
Навигацией называется интерактивно управляемый пользователем процесс перемещения из одних узлов в другие
Простота языка программирования
Переносимость данных
Сведения должны переноситься с компьютера на компьютер независимо от применяемых технических и программных средств.
Управление данными в глобальных сетях
Использование Интернета для управления данными
характеризуется следующими достоинствами
• дешевая клиентская программа-браузер;
• простота разработки приложений;
• стандартные отношения «клиент — сервер»;
• неограниченная размерность базы данных;
• возможность подключения очень большого числа пользователей.
Управление неструктурированными данными в глобальной сети
Клиент стали называть веб-браузером (иногда — просто браузером), сервер приложений — веб-сервером (www-сервером).
При получении запроса от веб-клиента веб-сервер предоставляет пользователю конечную информацию, а не полуфабрикат, как в режиме «клиент — сервер».
Недостатки
слабый контроль ввода браузера;
отсутствие средств управления транзакциями;
сложность структуры;
недостаточная безопасность данных.
статичность передачи данных на веб-браузер
Чтобы добиться динамичности публикации, на веб-сервере создают модули расширения
сценарии, скрипты, scripts
небольшие подпрограммы, добавляемые к основному HTML-коду и написанные на одном из языков PHP, JavaScript, Jscript, VBScript.
Задача скриптов принять и обработать запрос, извлечь из сервера БД нужные данные
Развитие процедуры управления данными
eXtensible Markup Language (XML)
метаязык, являющийся расширением языка разметки HTML, предоставляет возможность гибкого иерархического структурирования данных
удобно применять для обмена документами между разными информационными системами
XML-документы понятны как человеку, так и компьютеру, а их обработка не зависит от ОС.
«встраивание» XML-документа в реляционные СУБД, т. е. гибридные SQL/XML базы данных.
XML-данные хранятся в одной или нескольких столбцах таблицы в иерархической форме
Обработка SQL- и XQuery-запросов ведется разными анализаторами, но единым компилятором
Семантического Web
RDF-язык
предполагает наличие нескольких XML-документов:
исходный документ;
представление исходного документа в виде, удобном для человека;
преобразования RDF/OWL для представления различных семантических аспектов исходного документа.
Технологии
Глобальная схема имен Uniform Resource Identifier (URI) — для идентификации объектов Web.
Модель данных для описания семантики предметной области Resource Description Framework (RDF).
Стандартные способы описания свойств объектов RDF Schema (RDFS)
для создания словарей, которые более глубоко описывают связи понятий
Стандартные способы описания связей между объектами Web Ontology Language (OWL)
определяет интеграцию теории баз данных и теории систем искусственного интеллекта.
Облачные вычисления
технология распределенной обработки данных, в которой компьютерные ресурсы и мощности предоставляются пользователю как интернет-сервис
основных характеристики, которые отличают от обычного сервиса:
• режимность «ресурсы по запросу»;
• эластичность;
•независимость от элементов управления инфраструктурой.
категории
программное обеспечение как услуга (SaaS)
платформа как услуга (PaaS)
возможность использования облачной инфраструктуры для размещения базового ПО для последующего размещения на нем новых или существующих приложений
инфраструктура как услуга (IaaS)
возможность использования облачной инфраструктуры для самостоятельного управления ресурсами обработки, хранения, сетей и другими фундаментальными вычислительными ресурсами.
+
• экономия затрат на приобретении, поддержке, модернизации ПО и оборудования;
• масштабируемость, отказоустойчивость и безопасность;
• удаленный доступ к данным в облаке;
• высокая скорость обработки данных;
• оплата за использованные услуги по мере необходимости;
• экономия дискового пространства.
--
• зависимость целостности пользовательских данных
от компаний, предоставляющих услугу;
• необходимость наличия надежного и быстрого доступа в сеть Интернет;
• отсутствие общепринятых стандартов в направлении
безопасности облачных технологий;
• возможность появления облачных монополистов;
• опасность хакерских атак на сервер.