Le sicilien parmi les nouvelles langues de Google Translate grâce à un groupe de Palermitains : « Sauvons notre dialecte »

Le sicilien parmi les nouvelles langues de Google Translate grâce à un groupe de Palermitains : « Sauvons notre dialecte »
Le sicilien parmi les nouvelles langues de Google Translate grâce à un groupe de Palermitains : « Sauvons notre dialecte »

Le dialecte sicilien fait désormais partie des langues traduisibles sur Google. C’est la dernière innovation introduite par le géant américain : Google Traduction il a en fait élargi la gamme de choix de langues prises en charge. Pour ce faire, il a pu compter non seulement sur le soutien de l’intelligence artificielle, mais aussi sur un groupe de linguistes de Palerme.

Nous parlons de la Cademia Siciliana, une sorte d'”Accademia della Crusca” sicilienne. L’association, fondée en 2016 en Floride et en 2018 en Italie, vise à sauvegarder la langue sicilienne à travers l’étude, la recherche et l’activisme. “Au fil des années, nous avons réalisé diverses activités – dit un PalermeAujourd’hui David Paleino, l’un des bénévoles – et nous collaborons également avec Mozilla pour la traduction de Firefox.”

Les deux fondateurs, Salvatore Baiamonte, linguiste de Palerme, et Paul Rausch, originaire de San Biagio Platani (Agrigente), mais né en Floride, sont aujourd’hui rejoints par une dizaine de bénévoles. De nombreux projets sont en cours : « Nous avons inclus le sicilien dans le référentiel de données en langue commune Unicode – dit-il -, nous avons publié la première revue entièrement en sicilien, la revue officielle de l’UNESCO Le Courrier (Lu Curreri). Nous avons également traduit Minecraft et l’application de messagerie instantanée Telegram Nous avons notre propre page sur Wikipédia en anglais.

Ce n’est pas la première fois que le groupe collabore avec Google. “Nous avons été appelés pour créer Woolaroo – dit Paleino – qui est une application de réalité augmentée qui inclut le sicilien. Nous avons également implémenté la langue sicilienne pour les sous-titres sur YouTube et inséré la langue sicilienne sur le clavier GBoard pour Android”.

Outre le sicilien, parmi les 110 nouvelles langues mises en œuvre par Google Translate, on trouve également le vénitien, le frioulan, le lombard et le ligure. “Notre intérêt – conclut-il – est de sauvegarder la langue que presque plus personne ne parle parmi les jeunes. Et si personne ne fait rien, elle sera perdue. Je suis dentiste et je parle en sicilien avec mes patients. Nous devons supprimer le le stigmate de parler en dialecte, c’est le ‘tascio’. Nous sommes bilingues et si vous parlez en sicilien, vous n’êtes pas sans instruction, vous êtes comme quelqu’un qui parle en anglais.

Pour Google Translate, il s’agit de la plus grande expansion jamais réalisée, étant donné qu’en 2022, il a introduit 24 nouvelles langues, en utilisant la traduction automatique Zero-Shot, dans laquelle un modèle d’apprentissage automatique apprend à traduire une autre langue sans jamais voir d’exemple. Désormais, un développement ultérieur – nettement plus massif que le précédent – a été possible grâce à Palm 2, le grand modèle linguistique de Google.

PREV Avec cette voiture, vous faites le tour du monde en moins d’une semaine : incroyable comme il en faut peu, performances absurdes
NEXT Pourquoi la PS5 semble-t-elle plus puissante que la Xbox Series Digital Foundry a la réponse