Il progetto architettonico della piattaforma prevede tre livelli logici (o layer). Ogni livello contiene uno o più componenti, ciascuno fruibile come servizio sulla Cloud.
Tramite i tre livelli la piattaforma raccoglie dati da fonti eterogenee, li elabora, permette la creazione e fruizione di modelli. Per convenzione il flusso di raccolta ed elaborazione dati va dal basso in alto. Tuttavia si possono riconoscere, tra i molteplici possibili, alcuni flussi
che saranno particolarmente considerati, in particolare nei verticali. Ogni flusso corrisponde ad uno scenario fondamentale per la definizione e verifica di politiche della PA
1. La raccolta di dati da sensori, la loro integrazione con dati storici da sistemi informativi delle PA, la costruzione di modelli, la ripubblicazione in formato open (verticale energia, verticale sicurezza )
2. La raccolta di dati da sistemi informativi della PA, la loro integrazione, la costruzione di modelli (verticale welfare), la ripubblicazione dei modelli in formato open
3. La raccolta e analisi di sentiment sulle politiche PA dai social network (verticale welfare)
4. La richiesta esplicita e puntuale da parte della PA e raccolta di suggerimenti e commenti dai social network.
5. La pubblicazione delle politiche da parte della PA in modo innovativo sui social network, con uso di social aggregation e serious games.
Il layer data collection si occupa della raccolta dei dati da fonti eterogenee: sensori fisici (o in generale Internet of Things), social networks, altri sistemi informativi o basi di dati (in particolare della PA). Tutte queste modalità di raccolta verranno utilizzate dai verticali. Le problematiche di questo livello sono:
- Identificazione delle diverse fonti dati e loro mappature
- Definizione interfacce per l’acquisizione dalle fonti dati previste, strutturate e non (crawling), connettori a supporto, individuazioni dei flussi dati, streaming
- Modalità di acquisizione dati da fonti (batch, ftp, streaming…)
- Acquisizione dei dati
Il layer data modelling si occupa di rappresentare e memorizzare dati. Le problematiche sono
- Mappatura delle fonti dati
- Determinazione della componente di memorizzazione del dato da mantenere persistente per la piattaforma analitica
- Sistema di Data Management con l’utilizzo di un sistema di data quality per l’integrazione, la profilazione, il monitoraggio, il data profiling, l’entity resolution.
Il layer model building and presentation si occupa di definire e validare modelli di vario tipo, costruiti a partire dai dati raccolti, e di renderli usabili in varie forme (report o modelli interattivi)
- Progettazione di un ambiente per la costruzione, la verifica, il test, la validazione ed il versioning di modelli analitici
- Progettazione di un ambiente per lo sviluppo di modelli predittivi
- Progettazione del componenti di social media analytics per l’analisi dei dati raccolti via crawler
- Identificazione dei dati da presentare e della tipologia di analisi/fruizione
- Progettazione di un ambiente di uso avanzato dell’informazione