Comment fonctionne l’Italie, le modèle national d’IA qui défie les grands LLM

Comment fonctionne l’Italie, le modèle national d’IA qui défie les grands LLM
Comment fonctionne l’Italie, le modèle national d’IA qui défie les grands LLM

Neuf milliards de paramètres, 50 000 jetons dans le vocabulaire et plus de 1 000 milliards de mots pour l’entraînement. Ce sont les nombres de ItalieLe grand modèle de langage (Llm) développé en 5 mois par la société informatique iGenius et formé sur supercalculateur Leonardo, géré par le Consortium Interuniversitaire Cineca, sur un Ensemble de données à 90 % composé d’informations en italien.

Sorti en mode Open source, Italia veut être un instrument d’évolution pour la recherche et les entreprises dans tout le pays, mais pas seulement. Le véritable objectif est de diffuser (au moins) une nouvelle approche des LLM dans toute l’Europe, “qui garantit un représentation égale de toutes les cultures et langues“, explique Uljan Sharka, fondateur et PDG d’iGenius, qui sera l’invité du Wired Next Fest à Milan le 15 juin.

Depuis des années dans le monde des modèles intelligents, Sharka présente Italia au moins un mois plus tôt que promis et ne le fait qu’en mentionnant ses “mesures compétitives”, pour se concentrer plutôt sur le “révolution sociale” que vous voulez des déclencheurs : “Les entreprises sont confrontées à de graves perturbations causées par le manque de compétences techniques. Il est urgent de démocratiser le savoir et remettre l’humain au centre de l’innovation, leur redonner le contrôle de la technologie». L’IA générative prend donc un rôle pouvoir régénérateurdéclenchant ce que Sharka appelle Renaissance numérique. L’Italie permettrait en effet “combler notre dette technologique en tant que pays et permettre de nouvelles applications d’IA à fort impact humain et social, avec les valeurs et les approches italiennes».

L’IA Act comme une opportunité

De grandes ambitions, sans négliger les aspects essentiels d’un modèle d’IA que l’on peut considérer comme fiable. Ils ont en fait été insérés en Italie filtres de sécurité spécifique à la langue italienne pour supprimer les contenus sensibles, explicites et à fort potentiel de biais, les limites pour un respect maximum des droits d’auteur et de confidentialité et garantie du respect de la réglementation européenne en matière d’intelligence artificielle, à compter deLoi sur l’IA.

Ennuyeuse pour la plupart des modèles existants, même pour l’européenne Mistral, la startup d’intelligence artificielle la plus financée (dont le co-fondateur, Cedric O, sera l’invité du Wired Next Fest de Milan le 15 juin), cette nouvelle loi en Italie devient L ‘opportunité de se démarquer comme, comment “base sur laquelle construire votre future conformité». Un tremplin pour la recherche, les administrations publiques et les entreprises qui disposent désormais d’un modèle qui parle, et surtout pense en italien car formé avec des “données de locuteurs natifs”. La majeure partie est publique (source Wikipédia, etc.) et avec l’ajout de données synthétiques, pour atteindre un grand nombre, et l’intégration de ceux de National Editorial. C’est le premier des partenaires qui a voulu contribuer à la formation d’Italia, en ouvrant ses archives historiques d’articles, mais à l’avenir on s’attend à ce que d’autres veuillent se joindre à nous.

L’Italie deviendra polyglotte

Pour lui aussi efficacité en termes de coûts et de ressources»,L’Italie représente un bon moyen d’utiliser les fonds publics, permettant des projets compétitifs et ouverts qui génèrent de la valeur pour la communauté.» explique Alessandra Poggiani, directrice générale de Cineca. Il peut paraître étrange de trouver un consortium universitaire comme co-protagoniste d’une telle aventure. Elle l’admet elle-même, expliquant qu’il existe au contraire une grande cohérence de vision. Le président de Cineca Francesco Ubertini Parle de “une rencontre avec iGenius qui a déclenché une étincelle, dont on ne voit aujourd’hui que le premier résultat».

Téléchargeable sur le site iGenius et, bientôt également disponible sur Hugging Face et les principales plateformes de développement de produits d’IA, L’Italie a encore toute la vie devant elle. Soutenir l’innovation des entreprises, notamment dans les domaines financier et industriel, numériser les organismes publics, évoluer, comme modèle, vers de nouvelles versions plus puissantes, précises et polyvalentes, toujours entre les mains d’iGenius et de Cineca.

En fait, Sharka souhaite voir se réaliser le rêve avec lequel tout a commencé, orchestrer des modèles plus verticaux et ascendants “à l’italienne”, pour créer un grand modèle modulaire multilingue et au nom de diversité. Cela signifierait donner à l’Europe et au monde une alternative aux LLM actuellement disponibles sur le marché, déjà conformes aux réglementations à venir, avec l’humain au centre et “contre la centralisation du pouvoir” il prétend. Et il explique : «Si nous continuions à utiliser uniquement les 4 modèles proposés par les 4 sociétés habituelles, toutes les connaissances du monde resteraient entre leurs mains. ».

PREV Tesla et incitations : 3 000 € à ceux qui n’en avaient pas
NEXT Bourses européennes sur l’égalité. La Piazza Affari est en rouge