Surveillance. L’IA ne parle pas toutes les langues

Surveillance
Surveillance

Envoyer un texto en langue mongole n’est pas chose aisée, car la plupart des logiciels ne reconnaissent pas ce système d’écriture. Pour les habitants de Mongolie intérieure, région autonome du nord de la Chine, c’est pourtant un avantage.

En 2020, lorsque les autorités chinoises annoncent la fin de l’enseignement dispensé en mongol, cette minorité – 18 % de la population – redoute la disparition d’un des derniers marqueurs de son identité culturelle. Très vite, la nouvelle circule sur le réseau social WeChat, de même que les appels à la résistance. Des parents défilent par milliers dans la capitale régionale, exigeant l’annulation de cette décision.

À l’exception notable des manifestations liées au Covid 19 en 2022, il est extrêmement rare d’assister à de grands rassemblements contestataires en Chine. L’étroite surveillance du web et des réseaux sociaux décourage tout débat public sur des sujets sensibles, et, a fortiori, l’organisation de manifestations. Du moins quand on s’exprime en mandarin. Car les carences en mongol des outils de surveillance automatiques ont permis aux locuteurs de cette langue de se coordonner relativement simplement.

La plupart des systèmes d’écriture qui existent dans le monde ont été numérisés suivant le standard mondial Unicode, mais le mongol a été si mal encodé qu’il est à peu près inutilisable. Pour écrire un texte dans leur langue, les Mongols ont donc recours à un mélange de logiciels concurrents et généralement incompatibles les uns avec les autres. Le clavier de mongol que propose WeChat est tellement compliqué à utiliser que les gens préfèrent généralement envoyer des captures d’écran de textes. Si elles ne sont guère commodes, ces conversations par photos interposées ont l’avantage d’être beaucoup plus difficiles à suivre et à décrypter par la censure.

À l’exception d’une soixantaine d’idiomes, les chercheurs en intelligence artificielle disposent d’un “faible niveau de ressources” sur les quelque 7 000 langues employées dans le monde. Le mongol fait partie de l’immense majorité des langues à peine représentées sur Internet en raison de la prépondérance de l’anglais. À mesure que la technologie progresse, les fonctions automatisées des moteurs de recherche ou des réseaux sociaux pourraient grandement s’améliorer pour les locuteurs de langues minoritaires.

Cet accès élargi à des outils et à des marchés pourrait être très bénéfique, mais cela réduira également la capacité de certains locuteurs, comme ceux du mongol, à échapper à la censure des autorités. Pour les groupes linguistiques historiquement marginalisés sur Internet, ces gains de confort et de fiabilité pourraient se faire au prix d’un renoncement à une part de liberté.

Éviter les mouvements contestataires

En Mongolie intérieure, lorsque les familles disaient leur colère sur WeChat, il était évident que les algorithmes de l’application ne parvenaient pas à déchiffrer l’écriture cursive du mongol, explique Soyonbo Borjgin, journaliste local qui a couvert les manifestations sur place. Les images et les messages vocaux que s’envoyaient les manifestants étaient protégés par l’ignorance des autorités chinoises : il n’existait pas d’intelligence artificielle (IA) capable de les comprendre, et les traducteurs de la censure ne pouvaient pas surveiller la totalité des conversations à caractère potentiellement subversif.

Depuis, Pékin redouble d’efforts pour faire disparaître la langue mongole de son territoire. Sensible à l’aspect technologique du sujet, Soyonbo Borjgin s’est intéressé à un système d’apprentissage automatique en cours de développement à l’université de Mongolie intérieure. Entraîné grâce à des documents numérisés à l’époque où l’État chinois finançait encore l’enseignement du mongol, ce système devrait permettre aux ordinateurs de lire cette langue. Au cours de son enquête, le journaliste a découvert que ce pr

voirenimages.net vous produit ce texte qui aborde le thème «  ». Le but de voirenimages.net étant de rassembler en ligne des données sur le sujet de puis les diffuser en essayant de répondre du mieux possible aux interrogations que tout le monde se pose. Cet article se veut reconstitué de la façon la plus correcte que possible. Si jamais vous projetez d’apporter quelques précisions autour du sujet «  », vous avez la possibilité de d’échanger avec notre rédaction. Dans les prochaines heures on rendra accessibles à tout le monde d’autres annonces autour du sujet «  ». Alors, consultez régulièrement notre blog.