Загальні вимоги до наборів даних, які оприлюднюються на Порталі відкритих даних Дніпровської міської ради

1. Підготовка даних

1.1. Для підготовки та оприлюднення наборів даних використовуються наступні підходи: автоматичне оприлюднення даних через API; експорт первинних структурованих даних із програмного забезпечення; підготовка наборів даних відповідно до шаблонів таблиць, передбачених Рекомендаціями Міністерства цифрової трансформації України.

1.2. Автоматичне оприлюднення даних через API використовується для наборів, що мають великий обсяг та/або динамічно оновлюються. Для оприлюднення даних може бути використане API прикладного програмного забезпечення, що використовується для роботи з даними, та/або API Порталу відкритих даних.

1.3. Експорт первинних структурованих даних здійснюється, коли для роботи з даними використовується спеціалізоване програмне забезпечення. Відповідальна особа періодично здійснює експорт файлів та їх завантаження на Портал відкритих даних. У випадку, якщо експортовані файли мають недоліки, відповідальна особа забезпечує їх виправлення.

1.4. Підготовка наборів відкритих даних за шаблонами, передбаченими Рекомендаціями Міністерства цифрової трансформації України, здійснюється в Microsoft Excel або аналогах.

1.5. Не допускається оприлюднення в наборах даних кодованих значень, за винятком ідентифікаторів та знесоблених даних. У випадку наявності кодованих значень, набір супроводжується відповідним довідником у формі ресурсу або описової інформації.

1.6. Пріоритетом для розпорядників інформації є автоматизація оприлюднення наборів та уникнення надлишкового дублювання даних. Під час упровадження або модернізації програмного забезпечення забезпечується можливість експорту наборів даних у відкритих машиночитаних форматах (CSV, XML, JSON), форматах електронних таблиць (XLS, XLSX, ODS) або надання доступу до даних через відкритий API.

2. Типи даних та формати файлів

2.1. Всі набори даних мають належати до одного з трьох типів даних: текстові, структуровані, геопросторові. Пріоритетним є оприлюднення структурованих та векторних геопросторових даних.

2.2. Під час оприлюднення наборів даних, що містять текстові дані, забезпечується виконання таких вимог: 2.2.1. Набори даних, що містять текстові дані, оприлюднюються у форматах DOC, DOCX, ODT, TXT, RTF, HTML; 2.2.2. Якщо набір включає значну кількість текстових документів, вони мають бути зібраними в один або декілька архів даних. Набір даних має містити таблицю з метаданими всіх текстових документів (назва, номер, дата видання, видавник тощо); 2.2.3. Якщо текстові документи розміщуються на веб-сайті, достатнім є оприлюднення таблиці з метаданими документів, включно з посиланнями (URL) на відповідні документи.

2.3. Під час оприлюднення наборів даних, що містять структуровані дані, забезпечується виконання таких вимог: 2.3.1. Набори даних, що містять структуровані дані, оприлюднюються у форматах XLS, XLSX, ODS, CSV, XML, JSON, RDF. 2.3.2. Набори даних, що містять структуровані дані, супроводжуються структурою. Структура включає описову інформацію про кожен ресурс та атрибут набору. Для наборів даних у форматах XLS, XLSX, ODS структура формується відповідно до вимог Рекомендацій Міністерстства цифрової трансформації України. Для наборів даних у форматах CSV, XML, JSON, RDF структура формується відповідно до вимог технічної документації форматів.

2.4. Під час оприлюднення геопросторових даних забезпечується виконання таких вимог: 2.4.1. Для векторних геопросторових даних використовуються формати: SHP, DMF, MID/MIF, DXF, XML, GeoJSON, GPX, LOC, ARINC, AIXM. 2.4.2. Для растрових геопросторових даних використовуються формати: GIF, TIFF, JPG, JPEG, PNG. Оприлюднення растрових геопросторових даних допускається за умови, коли відповідні векторні геопросторові дані є відсутніми. 2.4.3. Оприлюднення геопросторових даних містобудівної документації відповідно до Наказу Мінрегіону України «Про затвердження Вимог до структури і формату оприлюднення відомостей про містобудівну документацію у мережі Інтернет» від 15.08.2018 № 220.

2.5. Архіви даних використовуються за умови великого обсягу файлів або їх значної кількості. Для оприлюднення архівів даних використовуються формати: ZIP, 7z, Gzip, Bzip2.

2.6. Під час оприлюднення наборів даних можуть бути використані інші технології (стандарти даних), зокрема, RSS, GTFS (General Transit Feed Specification), WMS (Web Map Service) та інші.

2.7. Не допускається оприлюднення сканованих документів та наборів даних у форматах, які не підтримують автоматизоване оброблення електронними засобами.

3. Вимоги до електронних таблиць, що оприлюднюються у формі відкритих даних

3.1. Для оприлюднення електронних таблиць у формі відкритих даних використовуються формати: XLS, XLSX, ODS, CSV.

3.2. Якщо електронна таблиця ведеться у Microsoft Excel, для оприлюднення наборів даних використовуються формати XLS, XLSX. Не допускається оприлюднення електронної таблиці у форматі XML та її конвертація до інших форматів.

3.3. Під час оприлюднення електронних таблиць у форматі CSV забезпечується кодування файлів «UTF-8», роздільник значень в одному рядку – кома, розрив рядка – «CRLF». Інші вимоги визначаються технічною документацією формату. Відповідний формат експорту CSV-файлів підтримують Google Таблиці та LibreOffice/OpenOffice Calc. Якщо дані вимоги неможливо забезпечити, всі відмінності CSV-файлів зазначаються в описі ресурсу.

3.4. В електронних таблицях використовуються структура, назви колонок (атрибутів) та формати даних передбачені Рекомендаціями Міністерства цифрової трансформації України.

3.5. Електронні таблиці, що містять переліки, реєстри та інші структуровані дані, мають відповідати наступним вимогам: 3.5.1. Один ресурс має містити одну таблицю; 3.5.2. В одному рядку таблиці має бути один запис; 3.5.3. В одній колонці таблиці мають бути значення одного типу; 3.5.4. Дані в таблицях не мають надлишково дублювати наявну інформацію (кожен вид даних має зберігатися лише один раз); 3.5.5. Електронна таблиця не має містити додаткових елементів заголовків, реквізитів, пропущених рядків та колонок, об'єднаних комірок, приміток, коментарів, форматування тексту та комірок тощо; 3.5.6. Назви колонок (атрибутів) електронних таблиць мають містити лише латинські літери, цифри та нижні підкреслення. Назва кожної колонки (атрибуту) має бути унікальною і не перевищувати за довжиною 32 символи.

3.6. Електронні таблиці, що містять форми, бланки та інші неструктуровані дані (наприклад, форми бухгалтерської, бюджетної звітності тощо) мають відповідати офіційно затвердженим формам документів.

4. Вимоги до оприлюднення API

4.1. У наборах даних оприлюднюється одна або більше кінцева точка API (посилання (URL) для отримання даних). 4.2. В описі набору розміщується інструкція користувача та технічна документація АРІ.