La testata del Master in Giornalismo “Giorgio Bocca” di Torino

I dati sintetici sono la nuova frontiera dell’IA

condividi

Per proteggere la privacy ora i dati si producono in “laboratorio”. Sono i cosiddetti dati sintetici, dati generati artificialmente attraverso algoritmi di Ia che mantengono le proprietà statistiche e il potere predittivo dei dati originali, risultando quindi realistici. Shalini Kurapati, ingegnera fra le 50 “women techEU” e co-fondatrice della start up, Clearbox AI, con sede a Torino, se ne occupa ogni giorno. Una mossa azzeccata a detta di Gartner, società leader nella consulenza IT, secondo cui, nel 2025, il 60% dei dati utilizzati in progetti di intelligenza artificiale e di analytics saranno generati sinteticamente.

Quali sono i vostri principali obiettivi?                                                                                                               

“In Clearbox AI, il nostro obiettivo è di facilitare l’utilizzo dell’intelligenza artificiale, creando soluzioni per togliere i vincoli che ostacolano il giusto utilizzo di questa tecnologia da parte delle aziende, soprattutto dal punto di vista dei dati. Questo perché l’intelligenza artificiale, per far funzionare i modelli, ha bisogno di tanti dati e a volte è difficile avere accesso a una tale quantità. I problemi principali riguardano la privacy e la proprietà intellettuale di accesso: ci sono tanti progetti di intelligenza artificiale che non funzionano bene a causa di queste questioni. Noi, come Clearbox AI, forniamo soluzioni per risolvere questi problemi”. 

Quali sono i principali benefici dei dati sintetici?

“I principali benefici dei dati sintetici sono tre: permettono di tutelare la privacy e allo stesso tempo sviluppare modelli, forniscono più dati quando questi sono quantitativamente limitati e correggono i dataset che sono sbilanciati a favore di un gruppo. Questi benefici possono venire utilizzati in tanti ambiti. Noi abbiamo tante richieste dai settori bancari, dalle assicurazioni, dalla finanza e anche dal settore energetico e dalla telecomunicazione. Nel settore bancario, per esempio, lavoriamo nel rilevamento di frodi. In questo settore, c’è una forte componente di sbilanciamento dei dati: le banche non hanno abbastanza casi di frodi. Con i dati sintetici possono avere più esempi per poter sviluppare un modello di rilevamento più efficiente. Ma il nostro lavoro non è specifico di un settore, perché qualsiasi campo che abbia bisogno di dati affronta i problemi citati prima”.

Riuscite a risolvere anche problemi legati ai bias nei confronti delle donne e delle minoranze? 

“Nel nostro caso, applichiamo metriche di fairness, che ci permettono di vedere dove un gruppo è sovra o sottorappresentato e quali sono le caratteristiche per capire se questo dataset ha veramente un bias. Con i dati sintetici, poi, possiamo creare nuovi esempi basati su dati che abbiamo per aumentare la quantità di quelli che rappresentano le minoranze. Per esempio, è famoso il caso di Amazon: l’algoritmo dell’azienda discriminava il curriculum delle donne rispetto ai curriculum degli uomini. Questo succedeva perché l’algoritmo prendeva in considerazione dati storici nei quali le donne non erano rappresentate nel mondo del lavoro. Il problema era di dataset, il quale doveva venire aggiornato”. 

In generale l’Ia sta aumentando o diminuendo le diseguaglianze nel mondo? 

“L’intelligenza artificiale è una tecnologia molto potente. Per esempio, i dati sintetici sono un modo per ridurre questa diseguaglianza, in modo che non solo le grandi aziende come Open AI e Microsoft possano avere accesso ai dati per creare modelli. Ma c’è tanto lavoro da fare. In teoria l’Ia ha il potenziale di aumentare la prosperità, di ridurre la povertà, di dare più accesso all’educazione e alla sanità. Ma allo stesso tempo, se non non siamo attenti a distribuire il frutto di questo tipo di tecnologia corriamo il rischio di creare più disuguaglianze nel mondo”. 

Consiglierebbe Torino a un giovane o una giovane che vuole avviare una start up legata all’IA? Torino e l’Italia hanno qualcosa da imparare dall’Olanda, dove lei ha studiato? 

“Sicuramente sì. Torino è una città molto tecnologica ed è un posto che consiglio per l’intelligenza artificiale. La cosa importante è avere il network giusto: noi abbiamo una forte collaborazione con l’Incubatore I3P del Politecnico di Torino e le OGR . Ci sono, senza dubbio, tante opportunità. Ma  sicuramente l’Italia può imparare dall’Olanda, come l’Olanda può imparare dall’Italia: in questo ambito, direi che l’Italia potrebbe snellire la burocrazia”.

Shalini Kurapati, ingenera e co-fondatrice di Clearbox AI