Home » Node » 23344

Applicare l'intelligenza artificiale per trasformare l'apprendimento delle lingue. L’esperienza di Roberto Navigli

Portare l'apprendimento e la traduzione del linguaggio informatico più vicino al livello della comprensione umana. Questo l’obiettivo di Roberto Navigli, prossimo Professore Ordinario presso il Dipartimento di Ingegneria Informatica Automatica e Gestionale Antonio Ruberti (DIAG),dell’Università La Sapienza di Roma.

Il lavoro pionieristico del professor Roberto Navigli vincitore dell’ERC Starting Grant nel 2010, e dell’ ERC Consolidator Grant nel 2016, è stato utilizzato per fornire risorse lessicali su larga scala utilizzate da studenti di lingue, università e organizzazioni in tutto il mondo, ma potrebbe anche avere importanti implicazioni per l'intelligenza artificiale, la robotica e il futuro della traduzione automatica.

Un sogno di lunga data di molti esperti che lavorano nel campo dell'intelligenza artificiale (AI) è stato quello di sviluppare macchine in grado di dialogare e comprendere il linguaggio, indistinguibili da quelle di un essere umano. Per questo, un computer deve essere in grado di comprendere non solo il significato delle parole, ma anche il contesto delle frasi. È una sfida che Roberto Navigli affronta da oltre 20 anni.

 

Inserire il problema nel contesto

<<Una delle difficoltà principali è l'ambiguità delle parole; - spiega Roberto Navigli - ad esempio, se dico in inglese "per favore chiamami un taxi", di cosa sto parlando esattamente? Per un essere umano, il contesto dovrebbe essere chiaro, ma un computer potrebbe pensare che sto chiedendo di essere letteralmente chiamato "taxi!". Mentre gli esseri umani danno per scontato che le parole abbiano significati specifici in contesti specifici, questo non è il caso delle macchine. I computer devono essere in grado di scegliere il significato contestualedi una parola da un elenco; un processo chiamato "disambiguazione del senso delle parole”>>.

Una motivazione chiave alla base del lavoro finanziato dall’ERC è stata quella di affrontare l'ambiguità delle parole e avvicinare i computer alle prestazioni a livello umano. Il progetto ha riunito informatica, linguistica e linguaggio, nonché intelligenza artificiale e robotica, ma ciò che lo ha reso particolarmente ambizioso è stato l’obiettivo  di affrontare l'ambiguità delle parole in quasi tutte le lingue. 

 

Risultati con l'applicazione quotidiana

La ricerca di Navigli rappresenta un punto di riferimento nella traduzione multilingue e nella comprensione del linguaggio del computer. È stato sviluppato un enorme database di parole e sinonimi utilizzando algoritmi sofisticati ed è nata la piattaforma "BabelNet".

<<BabelNet è un dizionario per computer innovativo; – prosegue Navigli - ciò che lo rende diverso è che rappresenta il linguaggio come una relazione tra concetti. Ciò significa che le query non vengono eseguite a parole, ma in base ai concetti. I concetti correlati vengono quindi collegati, come in Wikipedia>>.

La piattaforma, che ha appena compiuto dieci anni, contiene più di 20 milioni di voci in 500 lingue. A titolo di confronto, la versione in lingua inglese di Wikipedia contiene poco più di 6 milioni di articoli. La risorsa viene utilizzata per la traduzione da più di 1.000 università in tutto il mondo. Gli studenti di lingue utilizzano anche BabelNet quotidianamente per trovare frasi e per chiarire le ambiguità dei testi tra le lingue.

<<Questo ha portato anche alla creazione di un'azienda, Babelscape, qualcosa che non mi sarei mai aspettato; - afferma Navigli - senza questo, sarebbe stato molto difficile rendere BabelNet sostenibile>>.

L'azienda impiega attualmente circa 25 dipendenti e collabora con diverse società multinazionali. L'Ufficio per la proprietà intellettuale dell'UE utilizza BabelNet anche per interpretare le domande di marchio e garantire la conformità in tutta l'UE.

 

I prossimi passi della ricerca.

Grazie a ulteriori finanziamenti ERC, Navigli ora spera di fare il prossimo salto concettuale per fornire semantica per testi indipendenti dalla lingua. In altre parole, questo consentirebbe a un computer di dare un senso a un testo, indipendentemente dalla lingua in cui è scritto il testo.

<<Se riusciremo a raggiungere questo obiettivo, ci avvicineremo sempre di più a ciò che gli esseri umani fanno con il linguaggio; - spiega Navigli - se leggo un testo in francese e voglio tradurlo in inglese, non intendo tradurlo parola per parola. Piuttosto, cerco di trasmettere il significato. Dopotutto, questo è ciò che fanno gli interpreti e questo è ciò a cui miriamo>>.

I potenziali usi finali potrebbero includere la robotica, con macchine in grado di essere istruite in qualsiasi lingua. La comprensione di questi comandi sarebbe indipendente dalla lingua espressa.

<<Questo ritorna al mio obiettivo originale, che è quello di consentire la comprensione - continua Navigli - il progetto è simile alle reti neurali. Poiché non possiamo "leggere" un cervello, dobbiamo usare rappresentazioni intermedie per spiegare cosa sta facendo una rete neurale. È lo stesso dobbiamo fare con lo sviluppo di macchine in grado di dialogare e comprendere il linguaggio>>.

 

Altri articoli sul tema sono stati pubblicati da Il Messaggero e dall'agenzia ANSA.

© Università degli Studi di Roma "La Sapienza" - Piazzale Aldo Moro 5, 00185 Roma