Please enable JavaScript.
Coggle requires JavaScript to display documents.
Модель данных для больших данных (Граф-схемы (Элементы граф-схемы (Ребра -…
Модель данных для больших данных
Свойства данных
Необработанность
Чем более необработанными являются данные, тем больше вопросов им можно поставить
Нормализация данных
Семантическая нормализация - процесс реорганизации информации из свободной формы в структурированную форму данных
Неизменяемость
Устойчивость к отказам, связанным с человеческим фактором
Простота
Вечная истинность данных
Модель, основанная на фактах
Свойства фактов
Атомарность
Нельзя разложить на более мелкие
Не страдают избыточностью
Обозначение отметкой времени
Распознаваемость
Обозначают ли одинаковые записи разные события или являются дубликатами
Преимущества модели, основанной на фактах
Можно запрашивать данные из любого момента истории
Данные устойчивы к отказам
Легко обрабатывать неполную информацию
Разделение уровней хранения данных и обработки запросов
Граф-схемы
Графы, фиксирующие структуру массива данных, сохраняемую с помощью модели, основанной на фактах
Элементы граф-схемы
Ребра - взаимосвязи между узлами
Свойства - информация о сущностях
Узлы - сущности схемы
Каркас реализации
- независящий от конкретного языка способ определить узлы, ребра и свойства схемы, который генерирует код, сериализующий/десериализующий объекты в схеме, чтобы их можно было сохранять в главном массиве данных и извлекать из него