L’innovazione, su più fronti, che gli open data stanno innescando si basa anche su scelte responsabili da parte di coloro che rilasciano i dati. Il dato si può definire aperto quando la scelta del contenuto, del suo formato e della sua licenza d’uso accoglie parametri davvero all’insegna del completo e libero uso da parte dei cittadini.
E’ passato quasi un anno da quando in questo sito abbiamo iniziato a parlare di open data.
In questi mesi, il progetto di apertura e messa a disposizione dei dati da parte di amministrazioni pubbliche e governi è stato consolidato da più parti e anche in Italia, passo dopo passo, la cultura del dato aperto sta permeando il governo e la gestione dei nostri spazi di vita comune, che siano quartieri, città o regioni.
L’approccio al rilascio libero tramite il web di misurazioni (perché i dati non sono altro che il risultato di una misurazione di un parametro, che sia per esempio, l’emissione di particolato nell’aria o il quantitativo di spesa per comprare un auto blu) effettuate con soldi pubblici è certamente un cambio di passo e mentalità notevole per le istituzioni, che segna davvero il passaggio dalla governance 1.0 alla governance 2.0. Ma la sola “liberazione” dei dati non è sufficiente a garantire che il singolo cittadino possa consultare, comprendere e usare i numeri rilasciati.
I motivi possono essere riassunti in tre grandi macrocategorie: scelta del dato, scelta del formato, scelta della licenza di uso del dato.
Scelta del dato
I dati che possono essere messi a disposizione possono essere dati interessanti per la comunità, ma possono essere anche dati che hanno poco valore, se non soltanto nel conferire trasparenza all’operato dell’amministrazione.
Nella procedura di apertura dei dati sarebbe quindi auspicabile che prima di tutto venissero “liberati” quei dataset considerati più interessanti dal punto di vista della popolazione (per esempio dati su ambiente, salute, traffico, bilanci pubblici).
Allo stesso modo i dati devono essere aggiornati il più possibile e in continuo. Rilasciare un set di dati per poi non aggiornarlo con le nuove misurazioni serve a poco. Dataset di rilevazioni del passato sono ovviamente fonte di informazioni preziose e forniscono elementi di paragone con dati aggiornati, ma il dato ha valore soprattutto nella sua evoluzione nel tempo e nel suo aggiornamento.
La diffusione di software (applicazioni) in grado di aggregare e leggere i dati può essere effettiva se le app lavorano su dati sempre nuovi.
E’ come se un quotidiano continuasse a proporre sempre le stesse vecchie notizie: chi lo comprerebbe?
Scelta del formato
Il rilascio dei dati, finora, non ha seguito prassi e standard consolidati. I dati possono essere quindi rilasciati in differenti formati, che possono essere o proprietari o open source.
Oltre a questo elemento, la differenza tra un tipo di formato e l’altro determina la facilità di estrazione, lettura e utilizzo dei dati.
Nella maggior parte dei casi, i dati (a esclusione dei dati di georeferenziazione che fanno categoria a sé) possono essere inseriti in una tabella all’interno di un documento pdf, possono essere in una tabella di un foglio elettronico o excel, possono trovarsi direttamente su una pagina web in html, possono essere stati esportati da un foglio elettronico e inseriti in un file .csv (Comma-Separated Values) o .xml (eXtensibile Markup Language). Inoltre, non essendoci appunto degli standard, esistono numerosi altri esempi, anche se usati meno, di formati in cui i dati possono essere rilasciati, come è possibile vedere anche sul sito di Open Government italiano.
La differenza tra un formato e un altro è sostanziale. Prendiamo il caso di voler lavorare su dati in una pagina html o in un file pdf. Per poterli usare e trasformarli in dati “computabili”, cioè utilizzabili per fare elaborazioni, strutturarli in maniera sistematizzata e quindi inserirli in un formato più comodo, come il foglio elettronico di calcolo, ci si trova davanti a due scelte: o l’inserimento manuale (ricopiando dato dopo dato, con probabili errori di copiatura e un quantitativo enorme di tempo) o l’utilizzo di un software che riesca a leggere i dati estrapolandoli da questi formati.
Questi software, chiamati scraper, “raschiano” pagine web e documenti altrimenti non utilizzabili (come i pdf) e sono il mezzo obbligato per arrivare al possesso e all’utilizzo pieno dei dati.
Non esistono però scraper che “vadano bene per tutte le occasioni”. Lo scraper è un mezzo flessibile che di volta in volta va adattato alla tipologia di documento e file che ci si trova davanti e che può essere scritto con linguaggi diversi (per esempio, PHP, Python o Ruby).
Si può quindi intuire facilmente che la perfetta gestione degli scraper non può essere fatta da un cittadino qualsiasi, ma da qualcuno che conosce l’informatica e la programmazione o che, almeno, ha ricevuto una formazione specifica per questo uso.
Quindi una serie di dati “open” inserita in tipologie di formati che prevedono il raschiamento tramite scraper è di fatto aperta non a tutti, ma solo a una categoria di cittadini dotati di particolari conoscenze tecniche.
Scelta della licenza d’uso del dato
Dei dati rilasciati non ci si può fare tutto quello che si vuole. O almeno bisogna controllare che la licenza d’uso lo permetta: ogni amministrazione rilascia i dati, ma sotto specifiche licenze che possono essere più o meno aperte.
Le amministrazioni sono infatti titolari della proprietà dei dati che hanno prodotto direttamente (o di cui hanno commissionato la produzione), ma anche titolari del diritto d’autore sui prodotti che utilizzino e pubblichino quei dati (art.11 Legge n. 633/1941).
Quasi sempre (ma anche in questo caso non esistono standard) proprio nell’ottica open, le licenze sono di tipo aperto. Ad esempio le licenze Creative Commons in vario grado permettono l’uso (anche commerciale), la distribuzione e il riutilizzo dei dati, a patto che venga citata la fonte.
Nel contesto specifico degli open data amministrativi in Italia è nata poi l’Italian Open Data License (IODL) che prevede che “l’utente possa liberamente: consultare, estrarre, scaricare, copiare, pubblicare, distribuire e trasmettere le informazioni e creare un lavoro derivato […], includendole in un prodotto o sviluppando un’applicazione informatica che le utilizzi come base dati.”
La scelta di aprire anche all’uso commerciale è il passo in più che le amministrazioni devono compiere per permettere che software house e sviluppatori possano creare app commerciali sulla base dei dati rilasciati, in modo da creare nuove opportunità di lavoro e innovazione a livello locale.
Perché si possa allore gestire con responsabilità l’innovazione che gli open data stanno innescando, bisognerebbe quindi prendere in considerazione queste problematiche e concentrarsi sulle scelte migliori da fare in un’ottica che sia davvero di libero accesso per i cittadini.
——————–
(foto: No amount of data – From a digital painting series 2004-2006 di Dean Terry da Flickr)