Please enable JavaScript.
Coggle requires JavaScript to display documents.
Процедура перетворення інформації у формат відкритих даних (Визначення…
Процедура перетворення інформації у формат відкритих даних
Визначення формату даних для оприлюднення
Текстові формати: TXT, RTF, ODT, DOC(X), PDF (з текстовим
змістом, нескановане зображення), (X)HTML
Геопросторові дані: GeoTIFF, SHP, DMF, MID/MIF, DXF, ХML,
GeoJSON, GPX, LOC, ARINC, AIXM, растрові формати, векторні формати
Графічні дані: GIF, TIFF, JPG (JPEG), PNG
Відеодані: MPEG, MKV, AVI, FLV, MKS, MK3D
Аудіодані: MP3, WAV, MKA
Дані, розроблені з використанням програми Macromedia Flash: SWF, FLV
Архів даних: ZIP, 7z, Gzip, Bzip2
Формати представлення даних через API(XML, JSON, RDF)
Табличні формати: CSV, XLS/XLSX
Векторні формати (Файли з розширенням .dbf, .shp, .shx)
Конвертація даних у рекомендований формат
Текстові дані Notepad++
Очищення HTML документів від Word
Онлайн інструменти(JSON to CSV, CSV to JSON)
Microsoft Word, Microsoft Access, Microsoft Exsel
Програмні засоби (SPSS, Microsoft Azure MI, Matlab)
Графічні формати та PDF
Підготовка даних до оприлюднення у формі відкритих даних
Репеляційні бази даних
Експортування різних таблиць в один файл
Експортування даних з кожної таблиці в оркемий файл. Набір даних це декілька файлів з одним паспортом набору даних
Кодування файлів
Деперсоніфікація даних
Періодичність даних
Частооновлювані
Кожного дня
Кожного тижня
Більше одного разу в день
Рідкооновлювані
Кожного місяця
Кожного кварталу
Кожних пів року
Кожного року
По мірі зміни даних
Оприлюднення схожих даних з різними структураи
Якщо структура значно відрізняється, тофайли розглядаються як незалежні один від одного
Якщо структура схожа, то приймається за основу одна структура, а відсутні дані заповнюються пустими значеннями
Архівація наборів даних
Усі факти набору, що мають розмір більше 50 мб
застарілі версії наборів даних, якщо є
доступ до оновлених версій набору відкритих даних
якщо публікується багатотомний набір, тодірекомендується всі томи не копіювати і зберігати в одному архіві
Історичні дані
Отримання даних да допомогою API(Data Hub, API)
Переваги і недоліки відкритих форматів
Формати відкритих даних
XML
Недоліки
Відсутність підтримки типів баз даних без XSD
Переваги
Можливість перевірки даних та структури
Гнучкий
Підходить для перетворення даних на
інформацію
YAML
Переваги
Зручний для читання
Гнучкий формат
Підтримка типів
Зберігання бінарних даних
Недоліки
Мало розповсюджений
Синтаксичні особливості
CSV
Недоліки
Не підтримує стандартизацію
Не підтримує ієрархію
Не призначений для роботи з типами даних
Переваги
Має табличний вигляд
Можна прочитати людиною
Простий
Може бути відкритий текстовим редактором
JSON
Переваги
Підтримує типи даних
Стандартизований
Ієрархічний
Універсальний
Недоліки
Не можна прочитати людиною
Не розширюється
Підтримує обмежену кількість даних
Вимоги до даних
Достовірність
Валідність
Конкретність
Коректність
Очищення