Vai menu di sezione

Open Data

In maniera sempre più intensa, le organizzazioni pubbliche vengono invitate a rilasciare i propri dati in formato aperto, secondo licenze che possano permettere ed anzi facilitare il riuso dei dati prodotti dalla P.A. da parte di soggetti terzi, quali cittadini, imprese, altre P.A.

Per questo, tutti i siti e portali web realizzati con tecnologia ComunWeb sono predisposti per erogare dataset di elevata qualità, secondo il paradigma degli Open Data.

In questa direzione nel Luglio 2012 è stata approvata la Legge Provinciale (L.P. n. 16/2012) che prevede un obbligo nella diffusione del software libero e nel rilascio dei dati in formato open data.

Analogamente nel Dicembre 2012 è stata approvata la Deliberazione di G.P. n. 2858/2012, riguardante il rilascio delle linee guida Open Data per l'amministrazione pubblica del Trentino nella quale vengono elencate:

  • le tipologia di licenza
  • i formati di dati aperti da utilizzare
  • l’elenco dei metadati

Si riportano in sintesi le rispettive declaratorie di dettaglio, congiuntamente ad indirizzi di utilizzo, di cui alle “Linee Guida Open data per l’Amministrazione pubblica del Trentino”.

Tipologia di licenza

I dati dovranno essere licenziati avvalendosi di una delle seguenti tipologie di licenza:

  1. Licenza Creative Commons Zero (CC0) v1.0 Universal (testo integrale: http://creativecommons.org/publicdomain/zero/1.0/legalcode)
  2.  Licenza Creative Commons Attribuzione 2.5 (CC-BY v.2.5) (testo integrale: http://creativecommons.org/licenses/by/2.5/it/legalcode)

Solo per casi eccezionali, potranno essere previste licenze differenti o specifiche note di licenza.

Sul sito istituzionale per il rilascio dei dati saranno presenti e facilmente identificabili le informazioni relative alle licenze adottabili/adottate, nonché la loro traduzione.

Ove possibile, si consiglia di inserire un link ipertestuale alla spiegazione semplificata  relativa alla licenza stessa.

Formati di dati aperti

I dati di tipo aperto devono essere “accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti”, cioè resi pubblici, documentati esaustivamente e senza vincoli all'implementazione; “sono adatti all’utilizzo automatico da parte di programmi per elaboratori” (machine readable) e sono “provvisti dei relativi metadati”.

L’accessibilità da parte di altri programmi di elaborazione automatica è ottenuta attraverso l'uso di formati aperti tali da permettere di massimizzare le loro possibilità di riutilizzo e di interoperabilità.

Inoltre, il processo di creazione e pubblicazione dei dati è molto più semplice quando il formato di dato aperto viene adottato direttamente alla sorgente invece della riconduzione successiva con delle attività di trasformazione e modifica.

Per contro si osserva anche che, esistendo grandi quantità di dati in formati standard “de facto”, ovvero formati non aperti ma ugualmente leggibili e visualizzabili con software proprietari e open source (come per esempio il formato Microsoft Excel antecedente il 2003), può risultare necessario pubblicare i dati anche in questi formati.

La tabella seguente fornisce l’attuale elenco dei formati aperti maggiormente diffusi nell'ambito dell’amministrazione provinciale, riportando:

  • nella prima colonna, il nome, l’acronimo e una breve descrizione del formato;
  • nella seconda colonna; il tipo di dato pubblicato dal formato aperto;
  • nella terza colonna, l’estensione del file normalmente utilizzata per questo formato.

Da notare che quando un insieme di dati aperti è pubblicato in più file (es. ESRI shapefile) questi possono essere distribuiti all'interno di un file archivio compresso (es. “.zip”). In questo caso è necessario indicare il formato dei dati contenuti nell'archivio.

Nome (Acronimo)

Descrizione

Tipo di Dato Estensione del file

Comma Separated Value (CSV)

Formato testuale per l'interscambio di tabelle, le cui righe corrispondono a linee e i cui valori delle singole colonne sono separati da una virgola (o punto e virgola)

Dato tabellare .csv

Geographic Markup Language (GML)

Formato XML utile allo scambio di dati territoriali di tipo vettoriale

Dato geografico vettoriale .gml

Keyhole Markup Language (KML)

Formato basato su XML creato per gestire dati territoriali in tre dimensioni nei programmi Google Earth, Google Maps

Dato geografico vettoriale .kml

Open Document Format per dati tabellari (ODS)

Formato per l'archiviazione e lo scambio di fogli di calcolo

Dato tabellare .ods

Resource Description Framework (RDF)

Basato su XML, e' lo strumento base proposto da World Wide Web Consortium (W3C) per la codifica, lo scambio e il riutilizzo di metadati strutturati e consente l'interoperabilità tra applicazioni che si scambiano informazioni sul Web

Dato strutturato .rdf

ESRI Shapefile (SHP)

Lo Shapefile ESRI è un popolare formato vettoriale per sistemi informativi geografici. Il dato geografico viene distribuito normalmente attraverso tre o quattro files (se indicato il sistema di riferimento delle coordinate). Il formato è stato rilasciato da ESRI come formato (quasi) aperto

Dato geografico vettoriale .shp, .shx, .dbf, .prj

Tab Separated Value (TSV)

Formato testuale per l'interscambio di tabelle, le cui righe corrispondono a linee e i cui valori delle singole colonne sono separati da un carattere di tabulazione

Dato tabellare .tsv

Extensible Markup Language (XML)

E' un formato di markup, ovvero basato su un meccanismo che consente di definire e controllare il significato degli elementi contenuti in un documento o in un testo attraverso delle etichette (markup)

Dato strutturato .xml

Elenco dei metadati

Nello specifico ambito dei dati aperti, i metadati sono intesi come i “dati associati ai dati”, tali da informare gli utilizzatori del significato del dato stesso. La definizione stessa di metadato evidenzia l'ampiezza dei possibili metadati associabili ad un insieme di dati (dataset), ed è per questo che si ritiene opportuno identificare un insieme minimo di informazioni di base che possano essere utilizzate ai fini della ricerca, dell’accesso e dell’utilizzo del dato pubblicato.

Diventa altresì essenziale porre la massima cura nel fornire tali informazioni all’utilizzatore del dato.

Alcuni dati di settore includono anche il metadato già codificato in formato standard, ma nella maggior parte dei casi è necessario definire una documentazione di minima, non essendo disponibili standard precisi in tale senso.

In questo contesto, si riporta nel seguito un set minimo di metadati considerati indispensabili per la pubblicazione dei dati aperti.

Metadati: set minimo

Metadato Descrizione
Titolo Nome del dataset comprensibile da un utente generico. E’ il nome che viene mostrato all’utente quando consulta il dataset (es. “Limiti amministrativi comunali del Trentino”)
Titolare Ente titolare del dataset
Referente Struttura o Unità organizzativa referente  del dataset
Contatto Indirizzo email per la richiesta di informazioni
Descrizione Descrizione testuale del contenuto informativo del dataset
Categorie Categoria o categorie alle quali il dataset appartiene
Tag/Parole chiave Lista di termini associati al dataset che lo descrivono, e rendono possibile la sua classificazione e la sua ricerca
Documentazione tecnica Indirizzo delle pagine web che contiene informazioni utili alla comprensione del contenuto del dataset
Descrizione campi

Se non specificato nella "Descrizione" del dataset e  nella “Documentazione tecnica”, è necessario descrivere i campi (attributi) delle informazioni contenute nel dataset. Per esempio, nel caso di dato tabellare, gli attributi corrispondono alle colonne della tabella.  Le informazioni da specificare includono:

•Nome completo. E' il nome che viene mostrato all'utente quando consulta il dataset  (es. “Descrizione”)

• Nome breve. E' il nome dell’attributo utilizzato nel dataset, normalmente un’abbreviazione del nome completo (es.“Desc”)

• Descrizione. Illustra il significato del campo, eventuali relazioni con altri dataset, come il campo è stato generato, etc. (es.“Codice ISTAT del comune amministrativo”)

• Tipologia dell'attributo (testo, numero, data, etc.)

• Formato dell'attributo (es. unità di misura o struttura della data)

• Valori ammessi: rappresenta il dominio del attributo e ne contiene, ove necessario, la decodifica (es. “Il codice assume valori che vanno da 1 a 223, numero dei comuni totali della Provincia Autonoma di Trento”)

Copertura Geografica Territorio amministrativo di riferimento (es. “Trento”, “Provincia Autonoma di Trento”)
Copertura Temporale (Data di inizio) Data di inizio validità
Copertura Temporale (Data di fine) Data di fine validità
Aggiornamento Frequenza di aggiornamento (es. “mensile”, “annuale”, “giornaliera”)
Data di pubblicazione Data in cui il dataset è reso disponibile on-line
Data di aggiornamento Data di ultima modifica del dataset
Licenza Tipo di licenza applicata
Formato Formato di pubblicazione (standard) del dataset
Codifica Caratteri Codifica dei caratteri utilizzata (es. “latin-1”, “PC-850”)
Dimensione Dimensione in byte (o multipli di byte) del dataset
URI permanente Identificatore  univoco del dataset

Metadati opzionali

Metadato Descrizione
Autore Struttura o persona che ha creato il dataset
Email autore Email dell'autore
Data di creazione Data di creazione del dataset
URL sito Link web alla pagina o al portale istituzionale del dataset
Nome Nome del file che memorizza il dataset (es. “ammcom.shp”)

Modalità d'uso

Redazioni

Le redazioni potranno usufruire di tutte le abilitazioni e dell’opportuna interfaccia back-office che la piattaforma mette disposizione per facilitare il caricamento nel sito web e la distribuzione di dataset di qualità, nei formati previsti, con i metadati minimali e con la selezione obbligatoria della licenza di pubblicazione tra le licenze previste nei punti precedenti.

Cittadini ed aziende

Allo stesso tempo i fruitori dei dati, potenzialmente cittadini e aziende, potranno ricercare, accedere, fruire e scaricare i medesimi dati sia attraverso il sito web stesso, nel quale dovrà essere prevista una sottosezione "open data" e sia attraverso gli opportuni servizi web in modo tale da permettere la raccolta sistematica ed aggiornata dei dati e dei metadati pubblicati anche da parte di siti terzi (es. Dati.Trentino.it).

Pagina pubblicata Sabato, 03 Gennaio 2015
torna all'inizio del contenuto