La Geo Intelligence del Lab per il Covid19

Le elaborazioni di Alkemy Lab per la visualizzazione cartografica interattiva sul Covid-19

Nel contesto di quella che l’11 marzo 2020 è stata definita una pandemia di rilevanza mondiale dall’OMS, Il Lab ha avviato un think tank per il monitoraggio data driven dell’epidemia da Covid-19. Il think tank è stato inaugurato ancor prima che l'epidemia diventasse una minaccia nazionale e le ricerche hanno preso avvio dal 18 febbraio 2020. Oltre alle analisi relative ai flussi informativi su Twitter, Reddit e Telegram, sono state realizzate delle mappe navigabili online, con l’obiettivo di fornire visualizzazioni geografiche interattive.

Leggi l’articolo Covid-19 e cambiamento climatico, la social data intelligence realizzata da Alkemy Lab.

Il servizio, noto come Geo Intelligence, si basa sugli open data della Protezione civile italiana e della John Hopkins University, e rappresenta la diffusione della malattia a livello italiano e internazionale. Ogni elaborazione comprende inoltre delle analisi di contesto che permettono agli utenti di leggere i dati aggiornati e avere insight relativi all’area territoriale di interesse.

La mappa Covid-19: i dati del contagio in Italia analizza e rappresenta i dati raccolti dalla Protezione civile italiana sul numero di tamponi, contagi, decessi e guarigioni, suddivisi per regione e provincia.

Qui puoi navigare la mappa interattiva Covid-19: i dati del contagio in Italia

La seconda mappa di Geo Intelligence ha riguardato il monitoraggio dei dati sanitari sulla diffusione del virus a livello mondiale: Covid-19: disease tracking. Fonte dei dati in questo caso è la John Hopkins University.

Qui puoi navigare la mappa interattiva Covid-19: disease tracking

La mappa è stata rilanciata da:

Un’ulteriore mappa, inoltre, indaga i temi delle discussioni Twitter sul tema Coronavirus. Dopo una prima fase di raccolta da Twitter, tramite le API messe a disposizione dal social network, l’attività ha riguardato la pulizia e lo studio delle location utente, oltre ad un’analisi semantica del testo del tweet. Infine, l’utilizzo di moderne tecniche di NLP (Natural Language Processing) hanno permesso di processare e preparare il testo per l’applicazione di algoritmi di Topic Modelling. In particolare, l’implementazione della Latent Dirichlet Allocation sul corpus di tweet ha individuato tre topic di interesse: Geografia del COVID-19, Paura del contagio, Istruzione ed emergenza sanitaria.

Gli strumenti di machine learning, data mining e le analisi big data oggi disponibili e utilizzati dai data scientist, data analyst e data strategist si basano su algoritmi di classificazione, di data clustering, di rule discovery e frequent pattern analysis e permettono di scoprire, nelle sorgenti di informazione utilizzate, dati originali riguardanti trend temporali e geografici, evoluzioni nei comportamenti di singoli o di collettività, aggregazioni semantiche legate a concetti, termini o tematiche.

Mentre in passato la visualizzazione era limitata e ad una eventuale e non sempre facile analisi incrociata, attraverso la Geo Intelligence è possibile adottare nuovi modelli di rappresentazione dei dati, non più statici ma interattivi e volti ad un miglior utilizzo per i fini divulgativi, di programmazione e supporto alle decisioni, grazie alla rinnovata velocità di elaborazione.

Topic Modeling Covid-19

Qui puoi navigare la mappa interattiva Topic modeling Covid-19

La mappa è stata rilanciata da:

Le ricerche, le analisi e le mappe sono in aggiornamento continuo. Giornalmente è previsto il rilascio di nuove features incrociando dati e statistiche demografiche, climatiche, economiche e sociali.


Team

Alice Andreuzzi, Digital Project Manager

Alessandra Spada, Chief Technology & Research Officer

Luca Tacchetti, Strategist & Data Analyst

Stefano Vacca, Data Scientist