Google Traduction va parler Breton, Occitan et plus de 100 autres nouvelles langues

Google Traduction va parler Breton, Occitan et plus de 100 autres nouvelles langues
Google Traduction va parler Breton, Occitan et plus de 100 autres nouvelles langues

Le célèbre outil de traduction, qui propose déjà 133 langues, va en ajouter 110, dont des langues régionales.

Un polyglotte hors norme. Google traduction a ajouté, ce jeudi, 110 langues à son répertoire, à l’occasion de son plus «grand ajout jamais réalisé». dont le breton et l’occitan. «Ces nouvelles langues représentent plus de 614 millions de locuteurs, ouvrant ainsi la voie aux traductions pour environ 8% de la population mondiale», se félicite le géant américain de la Tech.

À découvrir

Parmi les options ajoutées figurent des langues régionales, dont le Breton et l’Occitan. Le cantonais, le tamazight, le romani, le wolof, le panjabi ou encore le Q’eqchi’ sont aussi intégrés. «Certaines sont des langues majeures dans le monde, avec plus de 100 millions de locuteurs. D’autres sont parlés par de petites communautés autochtones, et quelques-uns n’ont presque aucun locuteur natif mais font des efforts de revitalisation», précise l’entreprise dans une note de blog. Des langues telles que le panjabi, la langue la plus parlée au Pakistan, ou encore l’Afar, langue parlée à Djibouti, en Érythrée et en Éthiopie, sont disponibles.

«Le projet a duré quatre ans» confie à nos confrères de Ouest France Isaac Caswell, ingénieur logiciel pour Google Traduction. «Cette mise à jour est la plus importante de l’histoire de Google Translate et s’étend à de nombreuses autres langues non nationales et langues privées de leurs droits. Il comprend également plus de langues créoles que jamais, y compris le créole seychellois dérivé du français et le créole mauricien».

Les nouvelles langues ont été choisies «en fonction d’une combinaison mêlant les demandes reçues, le nombre de locuteurs et de la quantité de données disponibles pour les modèles d’entraînement» affirme Isaac Caswell. Catalysé par le modèle de langage PaLM2, socle de son IA générative Gemini, Google a utilisé l’intelligence artificielle pour entraîner son outil de traduction. «Nous avons consulté des linguistes, des experts, des traducteurs et des locuteurs natifs. Ils ont évalué la qualité du modèle et fourni des traductions», ajoute l’expert.

Revendications et initiatives Bretonnes

En février dernier, un collectif breton avait milité pour l’intégration du dialecte breton dans Google Traduction. Un pas «essentiel pour que le Breton et la Bretagne comptent dans le monde» expliquait David Lesvenan, président du fonds de dotation Bretagne numérique. L’office public de la langue bretonne avait également mis en place un dictionnaire historique et une base de données toponymique. Ces outils visent à asseoir la langue bretonne dans la sphère numérique avec plus de 60.000 mots traduits.

Après l’ajout de 24 nouvelles langues en 2022 avec la technologie Zero-shot, qui permet à un modèle d’apprentissage de traduire une langue sans s’appuyer sur des exemples et donc de mieux personnaliser le rendu, Google a lancé un plan, appelé l’initiative mille langues. Objectif : «créer des modèles d’IA qui prendront en charge les 1000 langues les plus parlées dans le monde».

voirenimages.net vous produit ce texte qui aborde le thème «  ». Le but de voirenimages.net étant de rassembler en ligne des données sur le sujet de puis les diffuser en essayant de répondre du mieux possible aux interrogations que tout le monde se pose. Cet article se veut reconstitué de la façon la plus correcte que possible. Si jamais vous projetez d’apporter quelques précisions autour du sujet «  », vous avez la possibilité de d’échanger avec notre rédaction. Dans les prochaines heures on rendra accessibles à tout le monde d’autres annonces autour du sujet «  ». Alors, consultez régulièrement notre blog.