CURRICULUM

WEB APPLICATION

LICENZA

CONTATTI

SKEY - Statistical Key Value Data Model

WEB SERVER

NOSQL DATABASE

LINGUAGGI

FORMATI OUTPUT

IL PROGETTO

Il Problema

I dati statistici spesso sono diffusi con un formato che dipende dai tools di export dell’ambiente (database, foglio excel) sul quale sono organizzati. Un set di dati può essere esportato nei formati csv, xml, json, rdf, odf, shape, kml, N3, RSS, ma non sempre questi formati sono facilmente utilizzabili dall’utente che li preleva.


L’elaborazione e l’uso dei dati si complicano se un utente deve utilizzare numerosi dataset statistici, provenienti da soggetti diversi ma su argomenti affini, disponibili in formati differenti.

Gli standards e i formati sono gli elementi principali che rendono un dato utilizzabile in più contesti, da diversi utenti e software. Basti pensare alle esigenze che può avere un ricercatore o il webmaster di un sito web istituzionale. Il primo ha bisogno di un formato facilmente utilizzabile con i software di data manipultaion, il secondo di un formato che consenta una rapida trasformazione e un veloce inserimento nel codice.


La maggior parte delle istituzioni rilascia i propri dati in un solo formato, discriminando inconsapevolmente gli utenti che sanno come utilizzarli da quelli che non lo sanno fare. Se, poi, un utente ha bisogno di mettere insieme più dati di uno stesso ambiente tematico distribuiti da più soggetti in formati diversi, l’usabilità diminuisce esponenzialmente e la difficoltà aumenta.

La soluzione

SODA, Statistical Open Data, è una web application che, unitamente a SKey (http://alessandrocapezzuoli.it/skey), consente agli utenti di scegliere il formato in cui esportare un sottoinsieme di dati statistici provenienti da più fonti: attualmente rilascia i dati in due formati (JSON e CSV), ma può essere ampliato senza difficoltà.


  • SODA si basa interamente su tecnologie open source ( Apache, Cassandra, PHP, AJAX) e può essere integrato in qualsiasi piattaforma web di Open Data (dati.gov.it o siti istituzionali) o generalizzato a qualsiasi ambito tematico in cui sono presenti dati disomogenei provenienti da diverse fonti che debbano essere unificati e rilasciati con uno standard unico. L’organizzazione dei dati è stata sperimentata su un modello di web linked data particolarmente complesso: il sistema informativo delle professioni, in cui confluiscono dati disomogenei. Per questo motivo, può essere applicato in numerosi contesti pubblici