Google Translate amplia incredibilmente il suo vocabolario e parla 110 nuove lingue, tra cui anche alcuni dialetti italiani. Si tratta della più grande espansione di sempre ed è stata possibile grazie all’aiuto dell’intelligenza artificiale. Tuttavia, la strada è ancora lunga per completare l’ambizioso progetto “1000 language initiative”, con l’impegno di supportare le 1000 lingue più parlate al mondo.
Google translate vuole abbattere le barriere linguistiche
“Google Translate abbatte le barriere linguistiche per aiutare le persone a connettersi e a comprendere meglio il mondo che le circonda”.
Google si sta impegnando a raggiungere sempre più persone possibili. Abbattere le barriere linguistiche è un progetto ambizioso ma molto importante.
Per riuscire in quest’impresa l’azienda si avvale del supporto di alcune intelligenze artificiali. Nel 2022, grazie al modello di apprendimento automatico Zero-Shot sono state aggiunte 24 nuove lingue.
L’obiettivo è quello di creare un linguaggio di intelligenza artificiale in grado di supportare e tradurre le 1000 lingue più parlate al mondo.
Oltre mezzo miliardo di persone raggiunte
Quelle annunciate recentemente sono ben 110 nuove lingue, la più grande espansione mai avvenuta nella storia di Google Translate.
Per rendere ciò possibile l’azienda ha iniziato a utilizzare un nuovo modello linguistico di grandi dimensioni: PaLM 2, il quale è stato addestrato su 400 lingue. Oltre all’aiuto dell’intelligenza artificiale, l’azienda si è avvalsa anche dell’aiuto di linguisti esperti e madrelingua.
Le lingue introdotte con l’ultima espansione rappresentano più di 614 milioni di persone nel mondo, ovvero circa l’8% della popolazione mondiale.
Google translate: le nuove lingue
110 sono le lingue introdotte, che vanno da lingue importanti, parlate da oltre 100 milioni di persone, come il cantonese, a quelle parlate da piccole comunità di indigeni, come il Q’echi’.
Un quarto delle nuove lingue introdotte proviene dall’Africa, come il Fon, il Kikongo, il Luo, il Ga, lo Swati, il Venda e il Wolof.
Scegliere le nuove lingue da inserire è un procedimento complesso, come ha spiegato l’azienda stessa: “Le lingue hanno un’immensa quantità di variazioni: varietà regionali, dialetti, standard ortografici diversi.
In effetti, molte lingue non hanno una forma standard, quindi è impossibile scegliere una varietà giusta. Il nostro approccio è quello di dare priorità alle varietà più utilizzate di ogni lingua”.
I dialetti italiani
Tra le 110 lingue introdotte troviamo anche diversi dialetti italiani, come il friulano, il ligure, il lombardo, il siciliano e il veneziano.
L’obiettivo di Google è preservare ed esaltare l’utilizzo dei dialetti, valorizzando il patrimonio linguistico e culturale italiano. Il dialetto non dovrebbe più essere relegato ai contesti informali e familiari, ma è una risorsa importante per il turismo e il dialogo interculturale.
Qualche problema con i dialetti italiani
Proprio l’introduzione dei cinque dialetti italiani ha portato a non poche polemiche, che gli utenti hanno apertamente esposto sul web.
In poche parole, secondo molti utenti, il friulano e il siciliano dovrebbero essere considerate e trattate come delle lingue vere e proprie e non come dei dialetti. Il ligure e il lombardo, invece, non esisterebbero proprio come dialetti, anche perché si compongono di una grandissima quantità di dialetti minori.
I dialetti, infatti, non sono solamente regionali, ma per la maggior parte delle regioni italiane essi cambiano da città a città se non, addirittura, da quartiere a quartiere. Proprio nel caso di Lombardia e Liguria sarebbe più corretto inserire i dialetti predominanti che, in questo caso sarebbero il Milanese e il Genovese.
Nonostante ciò le traduzioni nei e dei dialetti funziona abbastanza bene, sebbene ci siano diversi errori, come un tratto eccessivamente spagnoleggiante nel ligure.
Nuove tipologie di traduzione
Insieme all’introduzione delle nuove lingue Google ha annunciato anche nuove tipologie di traduzione: la possibilità di tradurre immagini e testi scritti a mano.