Dati aperti

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Open data)
L'indicazione chiara dei termini di licenza è una componente fondamentale dei "dati aperti", ed etichette iconiche come quelle in questa immagine hanno questo scopo.

I dati aperti, comunemente chiamati con il termine inglese open data anche nel contesto italiano, sono dati liberamente accessibili a tutti le cui eventuali restrizioni sono l'obbligo di citare la fonte o di mantenere la banca dati sempre aperta. L'open data si richiama alla più ampia disciplina dell'open government, cioè una dottrina in base alla quale la pubblica amministrazione dovrebbe essere aperta ai cittadini, tanto in termini di trasparenza quanto di partecipazione diretta al processo decisionale, anche attraverso il ricorso alle nuove tecnologie dell'informazione e della comunicazione; e ha alla base un'etica simile ad altri movimenti e comunità di sviluppo "open", come l'open source, l'open access e l'open content. Nonostante la pratica e l'ideologia che caratterizzano i dati aperti siano da anni ben consolidate, con la locuzione "open data" si identifica una nuova accezione piuttosto recente e maggiormente legata a Internet come canale principale di diffusione dei dati stessi. Gli open data sono fondamentali per il data journalism, o giornalismo di precisione.

Panoramica generale[modifica | modifica wikitesto]

Nonostante il concetto di dato aperto non sia nuovo, al momento non si riscontra un accordo generale e condiviso su di una definizione puntuale del termine, a differenza, ad esempio, di quanto già avviene con il software libero, l'accesso aperto o l'open source dove diverse dichiarazioni formali sono state comunemente accettate e condivise a livello internazionale.

Gli open data fanno di frequente riferimento a informazioni rappresentate in forma di database e riferite alla tematiche più disparate, ad esempio: cartografia, genetica, composti chimici, formule matematiche e scientifiche, dati medici e pratica, delle bioscienze, dati anagrafici, dati governativi, ecc. Vi sono alcune difficoltà oggettive che impediscono alla pratica dei dati aperti una larga diffusione.

I primi ostacoli per l'apertura dei dati vengono da restrizioni a monte quali privacy, segreto statistico, dati su flora e fauna protetta e interessi aziendali.

Uno dei problemi principali spesso riguarda il valore commerciale che gli stessi dati, visti sia in forma puntuale che aggregata, possono avere. I dati sono di frequente controllati da organizzazioni, sia pubbliche che private, che spesso mostrano reticenza di fronte alla possibilità di diffondere il proprio patrimonio informativo. Il controllo sui dati può avvenire attraverso limitazioni all'accesso, alle licenze con cui vengono rilasciati, ai diritti d'autore, brevetti e diritti di riutilizzo. Di fronte a queste forme di controllo sui dati, e più in generale sulla conoscenza, i sostenitori dell'Open Data affermano che tali restrizioni siano un limite al bene della comunità e che i dati dovrebbero essere resi disponibili senza alcuna restrizione o forma di pagamento. Inoltre, è importante che i dati, dopo essere stati pubblicati, siano riutilizzabili senza necessità di ulteriore autorizzazione, anche se determinate forme di riutilizzo (come la creazione di opere derivate) può essere controllato attraverso specifiche licenze (ad esempio Creative Commons, GFDL).[1] Pertanto, le licenze che non permettono il riuso a fini commerciali o le modifiche non sono considerate open data.

Una rappresentazione tipica della necessità dell'apertura dei dati viene proposta in una dichiarazione di John Wilbanks, direttore esecutivo dello Science Commons:

« Numerosi scienziati hanno sottolineato con ironia che proprio nel momento storico in cui disponiamo delle tecnologie per consentire la disponibilità dei dati scientifici a livello globale e dei sistemi di distribuzione che ci consentirebbero di ampliare la collaborazione e accelerare il ritmo e la profondità della scoperte... siamo occupati a bloccare i dati e a prevenire l'uso di tecnologie avanzate che avrebbero un forte impatto sulla diffusione della conoscenza. »

Inoltre accade spesso che gli stessi creatori di dati sottovalutino l'importanza degli stessi e non considerino la necessità di precisare le condizioni della proprietà intellettuale, delle licenze e del loro riutilizzo. Ad esempio, molti enti (siano essi di natura scientifica o governativa) per mancanza di consapevolezza dell'importanza dei propri dati non prendono in considerazione l'ipotesi di rilasciarli con licenze aperte. La mancanza di una determinata licenza che certifichi la possibilità di riutilizzare i dati rende difficile determinare lo stato di un insieme di dati e ne limita l'uso.

Diritti fondamentali[modifica | modifica wikitesto]

Secondo i sostenitori del movimento Open data, i dati andrebbero trattati come beni comuni; di seguito alcune delle argomentazione utilizzate a sostegno di questa tesi:

  • I dati appartengono al genere umano. Esempi tipici sono i genomi, i dati sugli organismi per la scienza medica, dati ambientali e meteorologici, ecc.
  • I dati prodotti dalla pubblica amministrazione, in quanto finanziati da denaro pubblico, devono ritornare ai contribuenti, e alla comunità in generale, sotto forma di dati aperti e universalmente disponibili
  • Restrizioni sui dati e sul loro riutilizzo limitano lo sviluppo della comunità
  • I dati sono necessari per agevolare l'esecuzione di comuni attività umane (ad esempio i dati cartografici, le istituzioni pubbliche, ecc.)
  • In campo scientifico il tasso di scoperta è accelerato da un migliore accesso ai dati.
  • È essenziale che i dati scientifici siano resi aperti per fare in modo che la scienza sia più efficace e la società ottenga il massimo beneficio dalle ricerche scientifiche.

Definizione[modifica | modifica wikitesto]

Il progetto Open Definition di Open Knowledge Foundation utilizza la seguente frase per definire dati (e contenuti) aperti: «un contenuto o un dato si definisce aperto se chiunque è in grado di utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla richiesta di attribuzione e condivisione allo stesso modo».[2]

La definizione, molto sintetica, viene poi meglio esplicata attraverso il documento "Conoscenza Aperta" i cui contenuti sono molto simili a quelli della OSI definition. Si tratta di 11 punti che mettono chiarezza sulle modalità di distribuzione e di accesso a tale informazioni. Fra questi ricordiamo: la possibilità di utilizzare a qualsiasi scopo i dati (quindi eliminando clausole quali la possibilità di lucro) e l'assenza di restrizioni tecnologiche (formati aperti ma anche il servizio d'accesso).

Il Legislatore italiano con la Legge 17 dicembre 2012, n. 221 ha formalizzato una definizione di dati aperti (formalmente "dati di tipo aperto") inserendola all'interno dell'art. 68 del Codice dell'Amministrazione Digitale.

Secondo tale definizione, sono dati di tipo aperto, i dati che presentano le seguenti tre caratteristiche:

  • a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;
  • b) sono accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera a), sono adatti all'utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati;
  • c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione.

Tale definizione, in coordinamento con quanto disposto dall'articolo 52 dello stesso codice, rappresenta la base per il cosiddetto principio open by default ora presente nell'ordinamento italiano.[3]

Gli open data nel panorama culturale contemporaneo[modifica | modifica wikitesto]

Open data rientra in un più ampio movimento di pensiero che mira a difendere i diritti dei cittadini/utenti con iniziative affini, da considerarsi parallele, sovrapporte in alcuni punti.

  • L'Open content è il "padre" dell'Open data: il primo si occupa principalmente di opere creative, il secondo di dati e ricerca scientifica.
  • Il software libero, che ha ispirato l'open content, è incentrato sulla libertà dell'utente oltre che sulla apertura del codice sorgente a beneficio del sistema sociale della produzione e distribuzione di software.
  • L'open source è concentrato sulla sola apertura del codice sorgente (e non sulla sua redistribuzione).

Le 5 stelle dei dati aperti[modifica | modifica wikitesto]

Tim Berners-Lee, il fondatore del World wide web, ha classificato il formato dei dati su una scala a cinque stelle: una stella corrisponde al minimo di apertura, cinque stelle al massimo[4]:
*Dato non strutturato e codificato in formato proprietario (esempi: un file pdf; un'immagine jpeg);
** Dato strutturato ma codificato in formato proprietario (quindi abbastanza facile da poter essere elaborato da un'applicazione informatica);
*** Dato strutturato in un formato non proprietario (per esempio, il formato CSV, che può essere aperto da qualsiasi software);
****Dati strutturati e codificati in formato non proprietario e dotati di un identificativo unico di risorsa (URI). Un esempio è lo standard RDF: applica al dato un significato condiviso (“quel dato ha lo stesso significato in qualsiasi lingua, per qualsiasi Paese”);
*****Dati aperti collegati ad altri insiemi di dati aperti (Linked data).

Nella scala di Berners-Lee, un dato può considerarsi aperto se ha almeno tre stellette.

Iniziative internazionali sul tema Open data[modifica | modifica wikitesto]

L'approccio aperto ai dati ha trovato applicazione in diversi paesi; di seguito vengono elencate alcune delle principali iniziative[5].

Stati Uniti[modifica | modifica wikitesto]

Una grossa spinta all'affermarsi del movimento Open data in ambito governativo è stata data dall' ex-presidente degli Stati Uniti d'America Barack Obama con la promulgazione della Direttiva sull'Open government nel dicembre 2009,[6] nella quale si legge testualmente:

« Fin dove possibile e sottostando alle sole restrizioni valide, le agenzie devono pubblicare le informazioni on line utilizzando un formato aperto (open) che possa cioè essere recuperato, soggetto ad azioni di download, indicizzato e ricercato attraverso le applicazioni di ricerca web più comunemente utilizzate. Per formato open si intende un formato indipendente rispetto alla piattaforma, leggibile dall'elaboratore e reso disponibile al pubblico senza che sia impedito il riuso dell'informazione veicolata. »

Alla direttiva sopra citata è stato dato un seguito "tangibile" attraverso il sito pubblico Data.gov, lanciato nel maggio 2009 dal "Chief Information Officer" (CIO) dell'amministrazione pubblica statunitense Vivek Kundra. Il sito è stato creato con l'obiettivo principale di raccogliere in un unico portale tutte le informazioni rese disponibili dagli enti statunitensi in formato aperto.

Italia[modifica | modifica wikitesto]

Logo del portale dei dati aperti della Pubblica Amministrazione italiana dati.gov.it

In Italia si è cominciato a parlare di dati aperti anche grazie al progetto OpenStreetMap. Con il fine di creare uno stradario liberamente utilizzabile, tra il 2007 e il 2010 alcune amministrazioni locali, grazie all'iniziativa di volontari (tra cui Ferrara, Merano, Vicenza, Montecchio Maggiore e Schio), hanno pubblicato con licenza aperta i dati dei propri stradari e altri propri dati. Il Ministro per la pubblica amministrazione e l'innovazione Renato Brunetta in una intervista[7] rilasciata il 3 giugno 2010 all'allora direttore di Wired Italia Riccardo Luna ha anticipato la realizzazione di un portale italiano dell'Open data sul modello dei datagov anglosassoni entro la fine dell'anno. In data 18 ottobre 2011 il portale dati.gov.it è stato messo on line.

La regione Piemonte nel maggio del 2010 ha realizzato il proprio portale regionale dei dati aperti dati.piemonte.it. Il sito resta al momento la più riuscita e strutturata esperienza nazionale sul tema dei dati aperti. La regione Emilia-Romagna ha seguito l'esempio piemontese nel 2011 con il suo sito Open Data.

Nel marzo 2012 FormezPA ha rilasciato la seconda release della licenza Italian Open Data License, indicata come IODL v2.0[8], priva di clausole del tipo "condividi-allo-stesso-modo" e con la sola richiesta di attribuzione della fonte per il riutilizzo dei dati. La licenza è progettata per i dati delle pubbliche amministrazioni italiane

Open Knowledge Foundation Italia e il Centro NEXA su Internet & Società del Politecnico di Torino hanno offerto il repository it.ckan.net dove chiunque poteva segnalare i dataset italiani disponibili online, assorbito da unico portale internazionale datahub.io/ Un servizio analogo era gestito dalla comunità del sito Spaghetti Open Data, ma il servizio è stato chiuso dopo il rilascio del sito nazionale, nel quale sono confluiti i dataset presenti. Da settembre 2012 è disponibile anche DatiOpen.it, un'altra iniziativa indipendente che offre a tutti servizi gratuiti di segnalazione, caricamento e visualizzazione.

Alla fine del 2012 è stato rilasciato il servizio Open Data Hub Italia che si è evoluto nel tempo e che oggi raccoglie in un ampio catalogo più di 38.000 dataset messi a disposizione da diverse organizzazioni sia pubbliche che private semplificandone la ricerca e l'accesso ai cittadini e alle imprese.

L'associazione di giornalismo investigativo e Radio Radicale hanno dato il via al primo corso strutturato di Open Data Journalism[9].

La comunità di maggior successo sul tema dei dati aperti si ritrova nella mailing list Spaghetti Open Data.

Dal 2013 la società Present SpA ha reso disponibile sotto licenza Creative Commons il modello aperto ODMC - Open Data Management Cycle, che propone un ciclo di gestione per i dati aperti pronto per l'uso e/o modifica delle Pubbliche Amministrazioni[10]. Il modello è attualmente impiegato nel Comune di Guidonia (che ha ricevuto il riconoscimento SMAU 2014[11] per la categoria Smart City) e nella Regione Umbria (adattato e rinominato in "Modello Operativo Open Data (MOOD) Umbria"[12]).

Note[modifica | modifica wikitesto]

  1. ^ Federico Morando, Legal interoperability: making Open Government Data compatible with businesses and communities, in JLIS.it, vol. 4, nº 1, 2013, DOI:10.4403/jlis.it-5461.
  2. ^ «A piece of content or data is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and share-alike.» Open Definition
  3. ^ Per maggiori dettagli sugli aspetti giuridici dell'open data in Italia si veda il libro Il fenomeno open data. Indicazioni e norme per un mondo di dati aperti di Simone Aliprandi (disponibile online sotto licenza CC by-sa).
  4. ^ 5 * Opena data, 5stardata.info. URL consultato il 7 marzo 2017.
  5. ^ (IT) Open Data - CyberLaws, in CyberLaws. URL consultato il 05 novembre 2017.
  6. ^ http://www.whitehouse.gov/omb/assets/memoranda_2010/m10-06.pdf [collegamento interrotto]
  7. ^ I fichi secchi di Wired a Brunetta
  8. ^ Testo della licenza IODL 2.0, dati.gov.it. URL consultato il 5 aprile 2012.
  9. ^ Open Data Journalism - Lectio Magistralis di Gian Antonio Stella 12 aprile 2012, radioradicale.it. URL consultato il 5 aprile 2012.
  10. ^ Modello Aperto ODMC - Open Data Management Cycle - Ciclo di Gestione Open Data, odmc.org. URL consultato il 24 agosto 2017.
  11. ^ Un Open Data Management Cycle per la pubblicazione dei dati pubblici in formato aperto all’insegna della trasparenza: il caso Comune di Guidonia Montecelio, smau.it. URL consultato il 21 agosto 2017.
  12. ^ Modello Operativo Open Data (MOOD) Umbria, regione.umbria.it. URL consultato il 21 agosto 2017.

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND: (DE1064023886