Please enable JavaScript.
Coggle requires JavaScript to display documents.
Карта схема (процедура) перетворення публічної інформації у формат…
Карта схема (процедура) перетворення публічної інформації у формат відкритих даних
Вибір формату для оприлюднення даних
Графічні формати
TIFF- популярний формат для зберігання зображень з великою глибиною коліру
JPEG - один із популярних графічних форматів, який застосовується для зберігання фото зображень і подібних до них зображень
PNG формат для зберігання графічної інформації, що застосовує стиснення без втрат Deflate. Розроблений для заміни форматів TIFF та GIFF
Текстово -графічні формати
HTML- стандартна мова розмітки документів інтернеті
DOCХ-формат файлу для зберігання електронних документів. Є zip-архівом, що містить текст у вигляді HTML графіку та інші дані, що можуть бути переведені в послідовність бітів.
PDF- формат файлу, що використовується для надійного уявлення і обміну документами, незалежно від апаратного забезпечення і рівня ОС. Можуть містити посиланні і кнопки, поля-форм, аудіо і відео елементи. Підтримують можливість електронного підпису і можуть переглядатись за допомогою безкоштовного програмного забезпечення Acrobat Reader DC
Текстові формати
TXT- формат, що містить текстові дані, які як правило організовані у вигляді рядків. Цей формат є основою для багатьох спеціалізованих форматів таких як: CHM, PHP,XSML, CSV та може бути переглянутий будь яким текстовим редактором
Markdown- полегшена мова розмітки, створена з метою створення максимального читабельного і придатного для редагування тексту , але придатного для перетворення в мови для публікації (HTML, RIch Text)
Формати даних для роботи з геопросторовими даними
GEO JSON
-відкритий формат призначений для зберігання географічних структур даних, заснований на JSON. Формат може зберігати примітивні типи для опису географічних об'єктів, такі як: точки (адреси та місця розташування), лінії (вулиці, шосе, кордони), полігони (країни, штати, ділянки землі).
Растрові формати
ADRG, RPF,CADRG, CIB Digital rastr grafic(DRG), ECRG, Esri grd, Gro TIFF,IMG- ERDAS,JPEG-,2000,MRrSID
KML- XML-позначення для вираження географічної анотації та візуалізації в двовимірних картах і тривимірних браузерах. KML був розроблений для використання з Google Earth, який спочатку називався Keyhole Earth Viewer. Він був створений Keyhole. Inc, який був придбаний Google в 2004 році. Даний формат став міжнародним стандартом Open Geospatial Consortium в 2008 році.
Google Earth була першою програмою, здатної переглядати і графічно редагувати подібні файли. Інші проекти, такі як Marble, також почали розвивати підтримку KML.
*формати GIS
інформація про атрибути
просторова або геометрична інформація
інформація про відображення
Векторні формати
shp
-головний файл, містить, набори геометричних даних
shx
-індексйний файл, який використовується для зв'язку між файлами shp,dbf
dbf
-атрибутний файл, містить атрибути обйєктів описаних в shp файлі у форматі d BaselV
формати представлення даних через AP
I
XML
стандарт побудови мов розмітки ієрархічно структурованих даних для обміну між різними застосунками, зокрема, через Інтернет.Є спрощеною підмножиною мови розмітки SGML. XML-документ складається із текстових знаків, і придатний до читання людиною.
JSON
це текстовий формат обміну даними між комп'ютерами. JSON базується на тексті, може бути прочитаним людиною. Формат дає змогу описувати об'єкти та інші структури даних. Цей формат використовується переважно для передачі структурованої інформації через мережу (завдяки процесу, що називають серіалізацією).
RDF технологія семантичної павутини, яка включає в себе середовище опису ресурсів (англ. Resource Description Framework, RDF), визначає загальну архітектуру метаданих і призначена для забезпечення сумісності метаданих за допомогою спільної семантики, структури та синтаксису. Технологія семантичної мережі передбачає розширення можливостей інтернету завдяки механізмам надання інформації чітко визначеного значення, яке дозволяє ефективно використовувати її у спільній роботі як комп'ютерів, так і людей.
Табличні формати
CSV
формат, котрий є відмежовувальним форматом для представлення табличних даних, у якому поля відокремлюються символом коми та переходу на новий рядок. Поля, що містять коми, декілька рядків, або лапки (позначаються подвійними лапками), мають обмежуватися з обох боків лапками.
Формат CSV використовується для перенесення даних між базами даних та програмами — редакторами електронних таблиць.
XLS/XLSX
Електронна таблиця створена в Microsoft Exel
Підготовка даних до оприлюднення у формі відкритих даних
оприлюднення даних за допомогою API та робота з даними великого обсягу
Data Hub
API
РЕПЕЛЯЦІЙНІ БАЗИ ДАНИХ
деперсоно фікація даних
кодування файлів
експортування даних різних таблиць в один файл
експортувати дані з кожної таблиці в окремий файл. Набір даних складається з декількох файлів, будуть мати один паспорт набору даних.
АРХІВАЦІЯ НАБОРІВ ДАНИХ
історичні дані
усі факти набору, що мають більше 50 Мб
застарілі версії наборів даних, якщо є доступ до оновлених версій набору відкритих даних
якщо публікується багатотомний набір, тоді рекомендується не копіювати усі всі томи і зберігати в одному архіві.
ПЕРІОДИЧНІСТЬ ДАНИХ
ЧАСТООНОВЛЮВАЛЬНІ
більше одного разу в день
кожного дня
кожного тижня
РІДКОВІДНОВЛЮВАЛЬНІ
кожного місіяця
кожного кварталу
кожних півроку
кожного року
по мірі зміни даних
ОПРИЛЮДНЕНННЯ СХОЖИХ ДАНИХ ЗА РІЗНИМИ СТРУКТУРАМИ
у випадку якщо структура файли значно відрізняється, то такі файли потрібно розглядати не залежно один від одного
якщо структура всіх фалів схожа і має не значні відмінності, то приймається за основу одна структура, а відсутні дані заповнюються пустими значеннями.
2 Конвертація даних у рекомендований формат
Microsoft Word?Microsoft Excel,Mcrosoft Acess
графічні формати та PDF:Adobe Photo Shop,Adobe Acrobate Reader,Paint,Net, Coler Draw
онлайн інструменти JSON to CSV,CSV to JSON
програмні засоби: SPSS,Microsoft Azure ML, Matab
текстові дані Notepade ++
очищення HTML документів від Word