Please enable JavaScript.
Coggle requires JavaScript to display documents.
ПУБЛІЧНА ІНФОРМАЦІЯ (Вибір формату публікації даних (СSV (простий,…
ПУБЛІЧНА ІНФОРМАЦІЯ
doc, docx, xls, xlsx, pdf, html
Вибір формату публікації даних
СSV
простий
компактний
є прямокутною таблицею
можна відкрити навідь текстовим редактором
людиночитаний
не стандартизований
легко пошкоджується
є прямокутною таблицею (не підтримує ієрархію)
типи даних відсутні
проблеми з кодуванням та МS Excel
JSON
стандартизований (ECMA-404, RFC 7159)
компактний і стуркурований
підтримує вкладення
підтримує типи даних (рядок, число, null)
людиночитаний
не розширюється
підтримує обмежену кількість типів даних
людиночитаний лише із форматуванням
xml
використання для перевірки структури DTD (Document Type Definition)
для перевірки даних - XSD (XML Shema Definition)
дуже гнучкий формат
генерація документів за допомогою XSLT (eXtensible Stylesheet Language Transformations)
відсутність підтримки типів даних без XSD
"важкий" формат
JAML
дуже гнучкий формат
підтримка типів даних
псевдо і якоря
зручний для читання формат
різні форми запису структур
складні ключи
зберігання двійкових (binary) даних
не розповсюджений
дуже специфічний синтаксис, чутливий до відступів
Структурування і очищення даних
Таблична структура
Усі змінні записані у стовпчиках
Усі спостереження записані у рядках
У таблиці немає об’єднаних комірок, один запис займає лише одну комірку
У таблиці немає об’єднаних записів, одна комірка містить лише один запис
Чистота даних
Немає помилок чи одруківок, зайвих символів або пропусків
Для запису назв, дат, чисел вживається уніфікований формат
Для позначення відсутніх записів використовується NA, а не “0”, “–” чи інші аналоги
У межах однієї змінної вживається лише один тип даних
інструменти перевірки
Dataproofer
OpenRefine
Знеособлення даних
персональні дані
конфеденційні дані
інформація з обмеженим доступом
Закон України “Про захист персональних
даних”
Закон України “Про доступ до публічної інформації”.
Оформлення набору даних
назва набору даних
опис набору даних
ключові слова
Структура набору даних
Назва елементу набору даних
(стовбець)
Формат
елементу набору даних
Параметри формату елементу набору даних
Призначення елементу набору даних (стовбець)
Визначення періодичності оновлення наборів даних
ПУБЛІКАЦІЯ ЯКІСНИХ НАБОРІВ ДАНИХ
структурованість
суспільний інтерес
деталізованість
актуальність
машиночитанність
словники
метадані
конвертер
конвертер
ознаки правильної структури
видалення
визначається
Паспорт