Durante le fasi più intense della pandemia da covid-19 molti di noi hanno scelto di rivolgersi a Internet e ai social media per trovare notizie, spiegazioni e riferimenti che ci aiutassero a orientare le nostre scelte. Il risultato è stato che la mole delle conversazioni online sulle misure di prevenzione inclusi i vaccini è cresciuta a dismisura. Un esempio: il primo dicembre 2019 venivano pubblicati circa 470 tweet in italiano sul tema vaccini. Esattamente un anno dopo, il primo dicembre 2020, i tweet su questo argomento erano 10mila, fino ad arrivare a 100mila tweet a fine dicembre, il giorno in cui è stato effettuato in Italia il primo vaccino anti covid-19.
L’infodemia può minare la fiducia nelle autorità e compromettere il successo di iniziative di salute pubblica
L’eccesso di informazioni online ha avuto un tale impatto sulle scelte di salute che l’Organizzazione Mondiale della Sanità ha deciso di utilizzare un termine specifico per definirlo: infodemia. Si tratta di un eccesso di informazioni, sia attendibili sia non attendibili, che crea confusione, può innescare comportamenti rischiosi, può minare la fiducia nelle autorità e compromettere il successo di iniziative di salute pubblica. Per contrastare l’infodemia occorrono competenze multidisciplinari negli operatori di sanità pubblica e il Corso di Perfezionamento CreSP, “Comunicare il rischio durante le emergenze sanitarie: dall’analisi delle sfide alla gestione dell’infodemia”, che partirà all’Università di Pisa il 15 febbraio punta proprio a rafforzare queste competenze.
In particolare, durante le emergenze sanitarie, è cruciale mettere in atto delle strategie di gestione dell’infodemia (infodemic management) per ridurre il suo impatto sulla salute dei cittadini. A tal proposito, l’OMS cita tra le prime azioni di questo processo l’ascolto sociale (social listening), in particolare attraverso i social media.
Ora, come fare ad analizzare le conversazioni sui social media se parliamo, ad esempio, di circa 10mila tweet al giorno (solo in Italia)? Sono diverse le strade possibili. Una è quella di estrarre un campione di post, cioè un numero di tweet più maneggevole, e leggerli uno per uno. Questa tecnica consente certamente di andare più a fondo nei contenuti, di apprezzare dettagli e sfumature, ma richiede molto tempo, energie e risorse. Ci siamo allora chiesti come fare ad analizzare migliaia e migliaia di post al giorno, ma in tempi brevi, per capire cosa le persone pensano dei vaccini. E abbiamo capito che la risposta stava nell’intelligenza artificiale.
L’intelligenza artificiale permette di analizzare grandissime quantità di dati, utilizzando meccanismi simili a quelli alla base del ragionamento umano. La branca dell’intelligenza artificiale che si occupa della comprensione del linguaggio si chiama Natural Language Processing (NLP), e negli ultimi anni si è evoluta molto velocemente (basti pensare agli assistenti vocali degli smartphone o dei computer).
Per fare analisi accurate non basta analizzare il “sentiment”. Con il Natural Language Processing è possibile individuare in modo chiaro anche la “stance”
Per classificare quello che le persone dicono sui social media rispetto ai vaccini, avremmo potuto usare degli algoritmi già disponibili e molto usati dalle aziende commerciali, che permettono di capire qual è il “sentiment” di un testo, ovvero se un utente esprime un parere favorevole o meno su un prodotto specifico. L’analisi del sentiment però non funziona molto bene quando si parla di vaccini. Se in un tweet me la prendo con una manifestazione di persone contrarie ai vaccini, il mio sentiment sarà negativo nei confronti dei manifestanti, ma, in effetti, positivo nei confronti dei vaccini.
Grazie all’aiuto di alcuni data scientist esperti di analisi del linguaggio naturale, abbiamo deciso invece di studiare un’altra dimensione: la stance, ovvero la posizione nei confronti dei vaccini espressa dall’utente, che può essere classificata in promozionale, scoraggiante, neutrale e ambigua (cioè, che esprime ambivalenza, ad esempio “voglio fare il vaccino ma ho paura”). Abbiamo chiesto a degli esperti di assegnare una di queste categorie a quasi 2mila tweet, e poi abbiamo usato questi tweet per insegnare ad un algoritmo a classificare i tweet da solo. Il risultato è stato ottimo: dopo l’addestramento, l’algoritmo è stato in grado di classificare correttamente altri tweet in quasi il 75% dei casi. In questo modo, possiamo sapere ogni giorno in pochi minuti quanti sono i tweet favorevoli, sfavorevoli e neutri nei confronti dei vaccini.
Negli ultimi mesi sono stati pubblicati dei nuovi algoritmi che potrebbero raggiungere livelli di accuratezza molto più elevati, oltre ad avere delle capacità di comprensione impressionanti: ad esempio, uno dei nuovi algoritmi è in grado di raccontare con un linguaggio molto semplice e incredibilmente coerente perché ha deciso di classificare il testo in un modo o in un altro.
L’ascolto delle conversazioni sul web si sta evolvendo rapidamente. Potremo avere a disposizione informazioni utili per la salute pubblica in maniera sempre più rapida e complessa – soprattutto se persone con diverse professionalità continueranno ad intrecciare le proprie competenze come stiamo sperimentando anche nelle ricerche portate avanti dal progetto CreSP dell’Università di Pisa. Il passo successivo sarà nelle mani delle istituzioni, che potranno utilizzare questi dati per orientare in maniera più accurata le iniziative di comunicazione, fornendo messaggi chiari, che rispondano alle esigenze informative del pubblico e che siano in grado di limitare gli effetti negativi della disinformazione. Se si baserà su questo tipo di dati, la comunicazione sulla salute consentirà di gestire davvero l’infodemia e avrà di conseguenza un impatto positivo sulla salute della comunità.