Big Data, social media, sentiment analysis, data journalism: per fare chiarezza un’intervista a Giuseppe Tipaldo, docente al Campus Luigi Einaudi di Torino.
Giuseppe Tipaldo, docente di Social Media Analysis e Big Data al Campus Luigi Einaudi«Analizzare i dati provenienti dai social media è la nuova forma di ascolto dell’opinione pubblica. I futuri professionisti della comunicazione ne avranno a che fare». Giuseppe Tipaldo, ricercatore post dottorato all’università di Torino, ha inaugurato ieri il corso in Social Media e Big Data al Campus Luigi Einaudi.
Che cosa si intende per big data?
Le definizioni di big data si sprecano, è un argomento di moda. Riassumendo, sono una quantità di dati reperibili attraverso i nuovi media e le tecnologie informatiche più avanzate che non è possibile processare e archiviare con le comuni tecnologie informatiche di tipo personal, perché non hanno sufficiente potenza di calcolo o spazio di archiviazione.
Quanto sono grandi questi dati?
Parliamo big data quando la mole di byte è nell’ordine di miliardi di miliardi di byte, una mole che esula dalla capacità di archiviazione che nei comuni dispositivi è nell’ordine di terabyte.
Che cos’è invece la social media analysis?
È un insieme di metodi e tecniche che hanno per obiettivo estrarre informazioni scientificamente attendibili dai contenuti presenti sui social network. Nel caso di Twitter, ad esempio, sono tweet, retweet, like; su Facebook, post, commenti, reazioni, condivisioni, e ogni tipo di statistica sull’andamento delle pagine, i cosiddetti insights. Usando i social lasciamo delle tracce: la social media analysis serve per andare oltre al livello immediato di comprensione di queste informazioni.
Il mercato del lavoro cerca analisti dei dati?
Questi tipi di professionalità cominciano a essere molto richiesti, soprattutto nei mercati tecnologicamente più avanzati, di cui l’Italia, in questo momento, non fa parte, anche se si sta adeguando.
I big data parlano da soli? Quali competenze ci vogliono per interpretarli?
Un corso come il mio si tiene all’interno di un Campus che ospita un dipartimento di economia, uno di scienze sociali e uno di giurisprudenza. Lo facciamo lì e non a matematica, ingegneria o informatica perché credo che gli analisti dei dati, almeno per i fenomeni di comunicazione di massa, debbano arrivare da studi di comunicazione, da un percorso umanistico.
Bufale: i numeri sono affascinanti come le fake news?
Sì, lo possono essere. Certo, per parte della popolazione il numero non è il metodo classico di comunicazione: è portata a esserne più sospettosa rispetto alla lingua parlata, perché se ne ha minore confidenza. Il fascino del numero, però, è tale da renderlo parte in causa delle bufale che si diffondono online. Il dato, nell’era dei big data e della comunicazione online, è diventato uno strumento retorico alle volte ancora più potente delle parole stesse. Il numero di condivisioni, ad esempio, interviene nel definire l’incisività della bufala, la rinforza.
Sicuramente le fake news hanno facile diffusione perché è meno impegnativo aderire, credere e twittare, condividere o mettere like a una notizia che ci confermi nei nostri pregiudizi piuttosto che metterle in dubbio. Rimanere nella propria comfort zone, nell’area delle proprie convinzioni assodate, è meno faticoso che metterle in discussione.
Pesare l’importanza, la qualità, la verità dell’informazione sulla base di un numero è una abitudine su cui vale la pena interrogarsi.
Parliamo dell’elezione di Trump: in quel caso i sondaggi e le analisi numeriche hanno fallito. Perché?
Gli strumenti con cui misuriamo gli atteggiamenti hanno un margine di errore statistico. Nel caso dei sondaggi, le risposte sono soggette a una serie di fenomeni: chi ha votato Trump può avere remore nel dichiararlo, può aver cambiato idea rispetto al momento del sondaggio. Insomma, gli strumenti con cui si fa opinion mining, cioè analisi dell’opinione pubblica, hanno un diverso grado di attendibilità. Alcuni dati in letteratura ci dicono che, sebbene oggi analizzare i social non dia lo stesso grado di rappresentatività dei classici sondaggi elettorali, il comportamento online dell’utente tende ad essere più sincero che in un’intervista asettica. Il mix di sondaggi e sentiment analysis sui social media sembra essere oggi la migliore soluzione per non prendere cantonate.
Parlando di dati non possiamo non parlare di data journalism. Che cos’è, secondo lei, e a cosa può servire?
Non siamo ancora arrivati a una fase matura del data journalism, che non è l’infografica o la componente grafica all’interno di una pagina. Questo è carino, ma è narrazione alternativa del dato, non data journalism. Per fare lo scatto decisivo c’è bisogno di team multidisciplinari con formazioni avanzate. Ciò significa investimenti consistenti da parte degli editori. Il data journalism vero e proprio, invece, è offrire notizie che non combattano direttamente con le fake news, ma indirettamente. Scrivendo articoli ben fatti, il giornalista è in grado non soltanto di recuperare le fonti, ma di elaborarle e di renderle in maniera divulgativa, riducendo la complessità senza distorcere troppo l’informazione. Se i giornalisti lo facessero, secondo me, avrebbe senso mantenere un albo dei giornalisti.
I dati prodotti dagli utenti, ad esempio nei commenti sotto agli articoli online, possono essere utili ai giornalisti?
Secondo me sono un patrimonio interessante che andrebbe tutelato, preservato, incentivato ed esplorato. Con quale obiettivo? Non per assecondare il sentiment di quei contenuti, ma conoscerlo per prendere decisioni a ragion veduta. È un peccato che alcuni giornali online mettano a disposizione spazi di commento soltanto in alcune aree tematiche e non dappertutto, anche se probabilmente è fatto per evitare che tutto si trasformi in una baraonda. Credo però che sia un discorso che i media online affronteranno presto.
MARCO GRITTI