I social media non sono voti: le primarie del centrosinistra e l’analisi predittiva

English version

Il fenomeno delle primarie del centrosinistra ha rappresentato il primo grande appuntamento italiano di partecipazione collettiva ad una iniziativa politica che ha trovato nei social network una fondamentale cassa di risonanza. Migliaia di cinguettii su Twitter e post su Facebook hanno trasformato la sfida alla candidatura per il ruolo di nuovo leader del centro-sinistra in un grande mosaico narrativo che ha visto politici e società civile giocarsi, armi alla pari, la capacità mediale offerta dai social media di rappresentare le proprie istanze, costituendosi come una appendice sempre più complementare alle arene istituzionali della comunicazione di massa. Lo dimostra, ad esempio, il dibattito che si è scatenato su Twitter durante il confronto televisivo tra i cinque candidati andato in onda su SkyTg24: secondo Blogmeter, la partecipazione ha battuto ogni record in Italia, con 127.426 tweet sull’argomento in un arco temporale che va da mezz’ora prima a mezz’ora dopo la trasmissione.
Se risulta indubbia, dunque, la capacità dei social media di dialogare attivamente con l’agenda dei mezzi di comunicazione più tradizionali, molto più controverso è l’utilizzo della innegabile mole di dati offerti dai social media come strumenti per sviluppare analisi di tipo predittivo sull’esito delle elezioni. D’altronde, già in occasione delle primarie repubblicane che si sono tenute negli Stati Uniti nel Giugno 2012, ci si era interrogati sui limiti teoretici delle analisi predittive, limiti che difficilmente possono essere superati attraverso l’implementazione di tecnologie più sofisticate di social media monitoring. Sebbene una recente ricerca realizzata da un gruppo di ricercatori dell’università di München in occasione delle elezioni tedesche, attraverso l’analisi del contenuto di oltre 100.000 messaggi di Twitter contenenti riferimenti a partiti o personalità politiche, ha dimostrato che i cinguettii possono riflettere le preferenze di voto e avvicinarsi alle predizioni elaborate dai tradizionali sondaggi elettorali, l’applicazione di complessi algoritmi alla mole di dati provenienti dai social media, è lungi dall’essere ancora un perfetto strumento previsionale (per una review della più recente letteratura si veda questo recente articolo sulle primarie americane).
Come ha spiegato Michel Wu, di Lithium Inc, per elaborare qualsiasi modello predittivo – dal possibile valore in borsa di un titolo Apple alle percentuali ottenute dai candidati di una competizione politica – occorre usare tre ingredienti: 1. un modello di algoritmo che calcola alcuni risultati previsti, come ad esempio l’influenza esercitata dal traffico generato dai follower di un candidato alle primarie; 2. una misura indipendente del risultato che il modello si prefigge di predire, come ad esempio l’andamento del consenso misurato attraverso uno strumento “esterno” alle metriche considerate 3. una misura che quantifica quanto il risultato previsto dalle metriche prese in considerazione si avvicina al risultato preso come variabile indipendente.
Il punto essenziale è il secondo: avere una misura che sia realmente indipendente dal risultato ottenuto attraverso l’uso delle metriche interne dei social media. Può sembrare un’ovvietà, ma il rischio è quello di cadere nel paradosso della circolarità di formule induttive che si limitano ad usare like e retweet come strumenti di validazione di modelli algoritmici che vengono estesi all’intera popolazione presa a riferimento. Da qui la necessità di assumere una variabile di confronto: nel nostro caso, i sondaggi elettorali.

Metodologia
Ispirandosi alla suggestiva ed efficace strategia utilizzata da Nate Silver per prevedere il risultato delle elezioni presidenziali americane, abbiamo deciso di approcciare alla questione dell’impatto dei social media sulla popolarità dei candidati da una prospettiva diversa dal solito. Sempre più di frequente i dati provenienti dai social media sono utilizzati come proxy del successo elettorale di un candidato o partito. Talvolta ci si basa su analisi quantitative, altre volte, con il supporto della sentiment analysis, si entra più nello specifico rispetto al contenuti scambiati. Il nostro approccio si basa invece sull’utilizzo dei dati diffusi dalle diverse società che realizzano sondaggi di opinione e sull’utilizzo dei dati provenienti dai social media per proiettare nel tempo e correggere il trend descritto dai sondaggi.

A questo scopo abbiamo raccolto 30 sondaggi di opinione realizzati fra il primo Ottobre 2012 ed il 23 Novembre 2012. I sondaggi sono datati sulla base del giorno di realizzazione e non di diffusione del sondaggio. Nelle giornate in cui sono stati svolti più di un sondaggio sono stati presi in considerazione i valori medi. I dati sono pubblicamente disponibili sul sito sondaggipoliticoelettorali.it.

Grazie alla collaborazione con Blogmeter, abbiamo inoltre raccolto – per i tre principali candidati (Pierluigi Bersani, Metteo Renzi e Nichi Vendola) e relativamente allo stesso periodo – tutte le principali metriche relative alle loro presenze ufficiali su Twitter e Facebook (numero totale di fan/followers, numero di nuovi fan/followers al giorno, Facebook People Talking About, Twitter Mentions, Facebook e Twitter engagement).

Dopo una serie di analisi preliminari basate sull’utilizzo di tutti gli indicatori provenienti dai social media, abbiamo provveduto a creare un modello previsionale per ciascun candidato basato su correttivi calcolati in base a Facebook People Talking About e Twitter Mentions. Le correzioni sono stimate sulla base del rapporto storico fra andamento del consenso misurato dai sondaggi ed andamento delle metriche prese in considerazione. Il modello, basato su una regressione lineare multipla, ci ha consentito di stimare dei valori correttivi per ottenere, sulla base del trend estrapolabile dai sondaggi, una previsione del risultato elettorale per ciascun candidato.

Come possiamo vedere dall’analisi dei grafici, nel caso di Pierluigi Bersani lo scarto tra il dato ottenuto dalle nostre previsioni ed il risultato elettorale è di 4.16 punti percentuale, mentre lo scarto che si può ricavare tra i dati forniti dalla media del rapporto storico del consenso misurato dalle rilevazioni dei sondaggi, in un periodo di tempo che va dal 1 Ottobre al 23 Novembre, è di 5.41 punti percentuale. Nel caso di Matteo Renzi, invece, lo scarto tra il dato ricavato dalle previsioni delle nostre metriche e il risultato elettorale è di 2.85%, mentre lo scarto che nasce dalla media dell’andamento storico dei sondaggi nell’arco di tempo considerato è di 3.33 punti percentuale. Se vediamo, infine, i dati relativi a Nichi Vendola, noteremo che il nostro scarto si attesta su una percentuale pari allo 0.09, mentre lo scarto tra dato elettorale e media dei sondaggi arriva allo 0.12.

Se ne evince che il nostro modello mostra una ottima capacità predittiva – evidente soprattutto nel caso di Nichi Vendola – rispetto alla media della serie storica dei sondaggi elettorali in un arco di quasi due mesi di tempo. Tale capacità deriva dal fatto che il modello è tarato su una metrica che combina assieme fattori di engagement ricavati sia da Facebook che da Twitter e procede ad analisi differenziate per ogni singolo candidato. Scorporando i dati per ognuno dei protagonisti delle primarie, si scopre, ad esempio, che non necessariamente il volume complessivo di mention ha una funzione positiva nei confronti del candidato ma che tale volume assume un senso diverso a seconda del candidato e, presumibilmente, a seconda dei contenuti. I nostri dati dimostrano, ad esempio, che le talking about di Vendola si traducono in un coefficiente negativo che, presumibilmente, va ad incidere nelle preferenze elettorali.
Queste analisi ci dimostrano quanto sia difficile costruire modelli previsionali che non tengano in considerazione le differenti strategie comunicative che caratterizzano i personaggi politici, ognuno dei quali si fa portatore di stili discorsivi, modalità di dialogo e capacità di gestione delle piattaforme digitali profondamente diverse. Senza considerare che il tipo di target privilegiato da ogni candidato può avere connotazioni sociodemografiche o culturali assolutamente discordanti. Non si tratta quindi di notare che, com’è ovvio, la realtà dei social media non è statisticamente rappresentativa del paese reale ma di affrontare il fatto che ogni singolo candidato avrà un responso all’interno dei social media che difficilmente potrà essere generalizzato.
Tutto questo ci porta a riconsiderare il rapporto tra modelli predittivi e social media, soprattutto quando ci troviamo di fronte a fenomeni così semanticamente complessi come la politica e la costruzione di una sfera pubblica capace di muoversi agevolmente tra dimensione online e offline.

La realtà predittiva e i social media
Alla luce di quanto detto, una prima considerazione da fare è che i social network non sono un luogo di osservazione in cui troviamo un campione rappresentativo né della popolazione né degli elettori. Si tratta di un appunto banale che però sembra diventare una realtà scarsamente trasparente dietro l’eccesso di attenzione sia giornalistica che delle analisi che segue ogni avvenimento politico, dibattito, ecc. che misurano il tasso di partecipazione politica del paese dal numero di tweet o dai commenti sulle pagine Facebook del singolo politico, dell’organizzazione politica, del programma televisivo, ecc.
In realtà quello che le ricerche cominciano a rendere evidente è che esiste un processo di autoselezione che porta ad un uso più politicamente intenso della Rete di quei cittadini che già sono interessati o attivi (Norris 2001) o che sono in possesso di risorse culturali e tecnologiche che li portano a sperimentare percorsi di cittadinanza attiva (Bentivegna 2009). In tal senso non troviamo un puro meccanismo di rispecchiamento tra atteggiamenti e pratiche del vissuto politico online ed offline della popolazione degli elettori. Almeno non in termini utili a meccanismi predittivi. Per banalizzare: non è il numero di follower di un candidato o il livello di engagement su una pagina Facebook di un politico rispetto ad un altro a poter diventare un elemento di previsione dell’orientamento di voto. Nelle primarie del centrosinistra, ad esempio, è stato Nichi Vendola ad avere più sostenitori connessi online, quasi 250 mila su Twitter e oltre 500 mila su Facebook e Matteo Renzi a sviluppare i livelli di engagement più elevati (vedi analisi dati di Vincenzo Cosenza), minore in queste dimensioni appare il dato di Pierluigi Bersani che ha invece accumulato più preferenze da parte degli elettori.
Questo non significa, però, che esista una differenza in termini assoluti tra realtà online ed offline. La crescente presenza della Rete nella vita quotidiana delle persone porta ad integrare l’esperienza di partecipazione politica (Dahlgren 2009) entro un continuum che comprende un agire nel mondo vicino, la fruizione mediale e pratiche di attivazione online da parte di alcuni elettori, mentre altri semplicemente non si auto rappresentano né vengono rappresentati dalla realtà osservabile online.

Sfere pubbliche connesse ed interpretazione della realtà
La domanda che possiamo farci allora è se sia possibile, ed in che modo, tenere conto di questa duplice forma di rappresentatività e quale relazione esista tra le due. Si tratta di una domanda che può dischiudere percorsi di ricerca interessanti in termini predittivi. Il senso che può stare dietro ai like che ottiene una pagina di un candidato su Facebook (Giglietto 2012) è certamente legato alla capacità dei candidati di stare online ed aprirsi ad un dialogo con gli utenti ma risente, per quanto riguarda la capacità di predire gli orientamenti finali degli elettori, di una limitatezza dovuta al fatto che quel “senso” va ri-orientato ad un contesto più ampio di costruzione e rappresentazione dell’opinione pubblica in cui i media mainstream hanno tuttora una specifica centralità. Abbiamo a che fare, quindi, con significatività e differenze di potenziale tra nodi di rappresentatività che necessitano di essere messi in relazione. Per questo motivo la nostra ricerca ha voluto ripensare l’utilizzo dei social media in chiave predittiva utilizzandoli non come una fonte privilegiata di dati, ma come una realtà da interfacciare con altri dati rappresentativi degli orientamenti di voto quali sono i sondaggi elettorali.
Ci troviamo infatti di fronte alla necessità di costruire una relazione fra sfere pubbliche diverse in cui si esprime un’opinione pubblica, pensiamo ai media mainstream, e un’opinione in pubblico, come avviene nei social media. La prospettiva da utilizzare è quindi quella di sfere pubbliche connesse (Boccia Artieri 2012). I social media, in questo senso, possono essere pensati come correttivi conversazionali dei sondaggi che indagano comportamenti di voto possibili. Si mettono così in relazione universi di sistema (la scelta tra più candidati possibili) e ambienti di contenuti UGC che si addensano attorno ai luoghi di visibilità discorsiva dei candidati, a partite dalle loro strategie di utilizzo dei social network intesi come strumenti di comunicazione politica personalizzanti ed orientati a visibilità ed engagement – pensiamo all’uso fatto di hashtag per aggregare ed aggregarsi attorno ad issue. Si tratta di una prima formulazione correttiva che trova riscontro nel nostro modello, il quale mette in relazione i sondaggi con i livelli di engagement del singolo candidato: Mentions su Twitter e Talking About su Facebook. A questi andrebbero aggiunti, per rendere in futuro il modello più complesso, i livelli di sentiment che riescono a tradurre quantitativamente i portati qualitativi presenti nei contenuti online. Esistono in tal senso sperimentazioni incoraggianti anche se resta aperto, in particolare in campo politico, il tema dell’ironia e l’interpretazione automatizzata di questa: come trattare in questo senso i contenuti su Twitter e Facebook dei Marxisti per Tabacci?
E d’altra parte occorrerebbe utilizzare anche altri elementi costitutivi delle sfere pubbliche quali i siti di news e i blog visti come luoghi di produzione e messa in circolazione di opinioni e aggregatori di engagement nei commenti, share, like, ecc. Il fatto, per restare al caso delle primarie, che Pierluigi Bersani sia il candidato che riceve un numero più elevato di citazioni da parte dei siti di news e blog ci sembra, in quest’ottica, essere rilevante. Questa ricerca sulle primarie della coalizione del centro sinistra in Italia rappresenta un primo passo verso un modello integrato che vuole sperimentare la possibilità di leggere una realtà complessa in cui online ed offline vanno pensate non come sfere mutualmente esclusive ma come un continuum.
Anche in chiave predittiva.

Team di ricerca
Giovanni Boccia Artieri – Università di Urbino Carlo Bo
Manolo Farci – Università di Urbino Carlo Bo
Fabio Giglietto – Università di Urbino Carlo Bo
Luca Rossi – Università di Urbino Carlo Bo
Elisabetta Zurovac – Università di Urbino Carlo Bo

Bibliografia di riferimento

Boccia Artieri G. (2012), Stati di connessione. Pubblici, cittadini, consumatori nella (Social) Network Society, FrancoAngeli, Milano.
Bentivegna S. (2009), Disuguaglianze digitali. Le nuove forme di esclusione nella società dell’informazione, Laterza, Roma-Bari.
Dahlgren P. (2009), Media and Political Engagement. Citizens, Communication and Democracy, Cambridge University Press.
Norris P. (2001), Digital Divide: Civic Engagement, Information Poverty and the Internet Worldwide, Cambridge University Press, Cambridge MA.
Giglietto, F. (2012). If Likes Were Votes: An Empirical Study on the 2011 Italian Administrative Elections. International AAAI Conference on Weblogs and Social Media; Sixth International AAAI Conference on Weblogs and Social Media. Retrieved from http://www.aaai.org/ocs/index.php/ICWSM/ICWSM12/paper/view/4577

About these ads
Tagged , , , ,

7 thoughts on “I social media non sono voti: le primarie del centrosinistra e l’analisi predittiva

  1. [...] cioè le diverse sfere pubbliche in cui potenziali elettori abitano e si esprimono. Come nella ricerca sperimentale che abbiamo fatto all’interno del progetto PRIN Social Network Studies Italia, in cui abbiamo messo in relazione sondaggi elettorali su tre candidati e livelli di engagement [...]

  2. [...] "ll fenomeno delle primarie del centrosinistra ha rappresentato il primo grande appuntamento italiano di partecipazione collettiva ad una iniziativa politica che ha trovato nei social network una fondamentale cassa di risonanza.   Migliaia di cinguettii su Twitter e post su Facebook hanno trasformato la sfida alla candidatura per il ruolo di nuovo leader del centro-sinistra in un grande mosaico narrativo che ha visto politici e società civile giocarsi, armi alla pari, la capacità mediale offerta dai social media di rappresentare le proprie istanze, costituendosi come una appendice sempre più complementare alle arene istituzionali della comunicazione di massa".   Leggi tutto: http://snsitalia.wordpress.com/2012/11/29/i-social-media-non-sono-voti-le-primarie-del-centrosinistra-e-lanalisi-predittiva/  [...]

  3. [...] di usare i Social Media in maniera predittiva sui risultati elettorali. È quello affrontato in una ricerca del progetto Social Network Studies Italia coordinato da Giovanni Boccia Artieri. La ricerca ha tentato di creare proprio un modello [...]

  4. [...] e social media» ha sarcasticamente commentato su Facebook Giovanni Boccia Artieri – il cui Social network studies ha usato i social media per “predizioni di voto” – a proposito del differenziale [...]

  5. [...] studio “I social media non sono voti: le primarie del Centrosinistra e l’analisi predittiva&#82…, realizzato da Giovanni Boccia Artieri, Manolo Farci, Fabio Giglietto, Luca Rossi e Elisabetta [...]

  6. [...] I social media non sono voti: le primarie del centrosinistra e l’analisi predittiva [...]

  7. [...] studiare, come fatto durante le primarie (qui le conclusioni raggiunte grazie al lavoro dell’Università di Urbino). Ecco cosa abbiamo [...]

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Follow

Get every new post delivered to your Inbox.

Join 47 other followers

%d bloggers like this: