sabato 8 dicembre 2012

Sull'utilità dei dati aperti

In seguito ad una discussione su twitter seguita all'articolo su CheFuturo dell'amico Napo, mi sono posto alcune domande: Perchè pubblicare dati se tanto, come dice il governo inglese, l'interesse è poco, le apps pure, ecc? Il problema, a mio avviso, è duplice e in entrambi i casi il fattore tempo è il fattore preponderante. Il primo problema è quello della qualità. I persiani utilizzavano il liquido scuro che usciva dalla terra per farci le lampade ad olio. Oggi sappiamo che la qualità di quel liquido scuro è molto bassa, e da quella esperienza abbiamo imparato che è necessario passare attraverso una fase di raffinazione che porta il greggio ad essere ripulito e quindi più facilmente riutilizzabile per realizzarci tutti i possibili prodotti dalle gomme delle auto alle cover degli iphone.
Il secondo problema è di tempo di risposta. Chi politicamente si impegna per l'apertura dei dati ha bisogno di un riscontro a breve/brevissimo tremine per giustificare l'azione o l'investimento. Il problema è che l'informatica ha illuso di poter dare immediatezza a tutto. Ma a questo livello di immediato c'è poco. Per creare una filiera di uso dei dati ci vuole del tempo, ci vogliono fallimenti, ci vogliono successi e ci vogliono copiatori. Non nasce in pochi anni una filiera del genere, a meno che una grandissima azienda non inizi a spingere sull'argomento. Ma a questo punto ci si trova davanti allo scoglio di qualità, quantità e freschezza. Come prima, torniamo al modello del petrolio. Chi investirebbe in un pozzo petrolifero senza fare i controlli del caso? Dove si trova il petrolio? Quanto ce n'è? Quanto va raffinato? La stessa operazione cinica e bara va fatta sui dati, soprattutto se chi ci vuole lavorare è una Startup.
E quindi in questa discussione, chi pubblica dati pre-aggregati non sta giocando a favore dell'uso dei dati. Chi pubblica pochi dati gioca a favore ma non cambia i pesi sulla bilancia. Quello che cambia i pesi sulla bilancia sono progetti come quello di Torino, con le API che danno i dati sui parcheggi in tempo quasi reale, e infatti proliferano apps. Quello che cambia i pesi sulla bilancia è il set di API fornito dalla MTA di NYC, che espone le informazioni sulla metro in tempo reale, e proliferano le apps. Poi possiamo discutere sul fatto che alcuni dataset sono più o meno complessi da utilizzare ed analizzare. E questo è fuori discussione. Il traffico è immediato, magari l'impatto delle decisioni della giunta del comune sul rimboschimento delle aree verdi della città meno. Ma questo non significa che non ci siano opportunità. E le opportunità arrivano con l'aumento di almeno due delle tre dimensioni. Qualità - Quantità - Freschezza.