Please enable JavaScript.
Coggle requires JavaScript to display documents.
Карта-схема (процедуру) перетворення публічної інформації у формат…
Карта-схема (процедуру) перетворення публічної інформації у формат відкритих даних
Вибір формату для опрелюднення даних
Текстові формати
«Markdown» — полегшена мова розмітки даних, яку створено з ухилом на прочитність та зручність у публікації з подальшим перетворенням її на structurally valid XHTML або HTML. Чимало ідей для мови позичено з існуючих домовленостей у розмітці тексту в електронних листах.
TXT - формат, що містить текстові дані, які, як правило, організовані у виглялі рядків. Цей формат є основою для багатьох більш спеціалізованих форматів, таких як CHM, PHP, XML, CSV та може бути переглянутий будь-яким текстовим редактором
Графічні формати
TIF - популярний формат для зберігання зображень з великою глибиною кольору
JPEG- один з популярних графічних форматів, який застосовується для зберігання фотозображень і подібних до них зображень
PNG - формат зберігання графічної інформації, що використовує стиснення без втрат за алгоритмом Deflate. Розроблений для заміни форматів GIF, TIFF. Для редагування графіки, зберігає графічну інформацію в стислому вигляді, причому стиснення графічної інформації проводиться без втрат.
Текстово-графічні формати
HTML - стандартна мова розмітк документів в інтернеті
DOCX - формат файлу для зберігання електронних документів. Є zip-архівом, що містить текст у вигляді XML, графіку і інші дані, які можуть бути перетворені в послідовність бітів
PDF - формат файлу,який використовується для надійного уявлення і обміну документами, незалежно від програмного і апаратного забезпечення або операційної системи. Можуть містити посилання і кнопки, поля форм, аудіо- та відеоелементами. Підтримують можливість електронного підпису.
Табличні формати
CSV - текстовий відкритий формат, призначений для представлення таблиць (масивів, наборів) даних, де кожний рядок - це запис таблиці, а значення окремих полів у рядку розділені спеціальними символами, зазвичай комами. Щоб завантажити записи таблиці за найменуваннями полів, додатково потрібно мати опис її структури - назви та формат полів.
XLS/XLSX - електронна таблиця, створена в Microsoft Excel. Дані зберігаються в комірках, кожна з яких має певну адресу.
Формати представлення даних через API
XML - текстовий відкритий формат, як основний для обміну інформацією в інтернеті. Гіпертекстована розмітка (HTML) - це один із різновидів XML. Разом з таблицями каскадних стилів CSS, які формують зовнішній вигляд документів, вони є тими основними форматами, що обумовлюють розвиток технологій
JSON - текстовий відкритий формат, призначений для обміну даними в інтернеті між сервером та клієнтом або сервером і сервером.
RDF - модель для представлення даних, особливо, метаданих. Представляє твердження про ресурси у вигляді, придатному для машинної оюробки
Формати для роботи з геопросторовими даними
GeoJSON - відкритий формат, призначений для зберігання графічних структурних даних, заснований на форматі JSON
формати GIS
просторова або геометрична інформація
інформація про атрибути
інформація про відображення
векторні формати
shp - головний файл
shx - індекстний файл
dbf - атрибут файл;
растрові формати : ADRG, RPF, CADRG, CIB, Digital raster graphic, ECRG, Esri grid, Gro TIFF, IMG-ERDAS, JPEG2000, MrSID/
KML - геоінформаційний формат Google MapsKML - мова розмітки на основі XML для представлення тривимірних геопросторових даних в програмі "Google Earth"
Підготовка даних до оприлюдненння у формі відкритих даних
кодування файлів
Репеляційні бази даних
експортування даних різних таблиць в один файл
експортуати дані з кожної таблиці в окремий файл.
деперсоніфікація даних
архівація набору даних
історичні дані
усі факти набору, що мають розмір більше 50 Мб
застарілі версії наборів даних, якщо є доступ до оновлених версій набору відкритих даних
якщо публікується багатотомний набір
періодичність даних
частооновлювальні
бльше одного разу на день
кожного дня
кожного тижня
рідкооновлювальні
кожного місяця
кожного кварталу
кожного півроку
кожного року
по мірі зміни даних
опрелюднення схожих даних за різними структурами
у випадку, якщо структура файлів значно відрізняється, то такі файли потрібно розглядати як незалежн одиг від одного
якщо структура даних сіх файлів схожа і має незначні відмінності, то приймається за основу одна структура, а відсутні дані заповнюються пустими значеннями
опрелюнення даних за допомогою API та роботою з даними великого обсягу
API
Data Hub
Конверція даних у рекомендований формат
Перелік деяких програмних засобів, що дозволяють конвертувати файли з одного формату в інший
Microsoft Word, Microsoft Excel, Microsoft Access
графічні формати та PDF: Adobe Photoshop, Adobe Acrobat Reader, Foxit PDF Reader, Paint.NET, Corel Draw
онлайн інструменти : JSON to CSV, CSV TO json
програмні засоби : SPSS, Microsoft Azure ML, Matlab
текстові дані: Notepad++
очищення HTML документів від Word