Skip to main content
Bâtir l’avenir numérique de l’Europe

Technologies linguistiques

Les technologies linguistiques ouvrent la porte à une Europe plus connectée, plus innovante et plus accessible.

Les technologies du langage (LT) permettent aux machines non seulement de lire, d’analyser, de traiter et de générer le langage humain, mais aussi, grâce aux progrès scientifiques récents, de combler le fossé entre la communication humaine et la compréhension des machines.

Puisque le langage sert de support fondamental pour l’interaction humaine, LT a acquis une importance immense dans divers secteurs et applications, de la traduction et de la localisation au support client, en passant par les soins de santé, la création de médias et le marketing. Les exemples courants de cette technologie sont la reconnaissance vocale, les assistants intelligents, la traduction automatique, les chatbots, la synthèse de texte et le sous-titrage automatique.

Que faut-il pour développer les technologies linguistiques?

Voici quelques-uns des éléments clés pour développer des outils et des services linguistiques.

  • Données linguistiques: il s’agit du contenu textuel ou parlé — dans une ou plusieurs langues — qui sert de matériel d’entrée ou de formation pour des tâches de traitement du langage naturel, par exemple la génération de texte ou l’analyse des sentiments. Ces données peuvent provenir d’une variété de sources — livres, articles, publications sur les médias sociaux, transcriptions de conversations parlées, etc. Puisqu’elles constituent le fondement du développement de LT, il est essentiel qu’elles soient collectées dans le plein respect des dispositions relatives au droit d’auteur (DPI) et à la protection des données à caractère personnel (RGPD).
  • Algorithmes de formation et modèles linguistiques: les algorithmes sont le logiciel, les «recettes», pour créer des modèles de langages humains. Avec des quantités substantielles de données de qualité, les derniers algorithmes d’apprentissage automatique ont montré des capacités accrues pour créer des modèles représentant les connaissances dérivées des données linguistiques. Plus les ressources et les modèles sont importants, plus leurs applications sont génériques et globales.
  • Puissance de calcul: D’importantes ressources informatiques sont nécessaires, en particulier lors de la création de modèles linguistiques, où l’informatique haute performance et les infrastructures cloud robustes sont cruciales.
  • Expertise humaine: le succès du LT implique une collaboration entre les linguistes, les spécialistes des données, les ingénieurs en informatique et les spécialistes du domaine.

Que fait l’Europe pour développer les technologies linguistiques?

En Europe, nous avons un paysage linguistique complexe. La Charte des droits fondamentaux de l’Union européenne interdit toute discrimination fondée sur la langue et impose à l’UE l’obligation de respecter la diversité linguistique. La responsabilisation, la transparence, l’équité et le respect de nos valeurs ne sont que quelques-unes de ses implications éthiques. Ces droits et principes ne peuvent être garantis que par une utilisation impartiale de la LT.

L’industrie européenne des TL joue un rôle clé dans l’autonomie stratégique et technologique de l’Europe, qui devrait encore être renforcée. Nos besoins spécifiques du marché sont surtout connus par les LT p roviderseuropéens, dont des centaines sont répertoriés dans le catalogue des services de traduction électronique.

Les solutions accessibles au public, y compris lesoutils et services offerts par la Commission européenne, complètent l’offre du marché tout en comblant une lacune dans le soutien technologique aux langues à faible ressources. Ces solutions de base — traduction automatique (eTranslation), reconnaissance d’entités nommées, résumé, transcription vocale et pseudonymisation des données pour la conformité au RGPD — sont à la disposition de toutes les administrations publiques européennes et des petites et moyennes entreprises dans toutes les langues officielles.

Dans le cadre d’Horizon 2020, le réseau européen des langues (ELG) a créé un guichet unique de solutions spécialisées de LT. Les efforts de diffusion et de renforcement des communautés ont contribué à favoriser une compréhension commune de la nécessité d’unir les forces publiques et privées et de bénéficier du meilleur des deux mondes en matière de recherche et de déploiement.

Le programme Horizon Europe encourage la recherche et l’innovation en soutenant le développement de LT avancés au-delà de l’état de la technologie, y compris les grands modèles linguistiques. Ces modèles, conçus pour améliorer l’interaction homme-machine, auront des capacités multilingues, géreront plusieurs modes d’entrée, géreront les biais et montreront la conscience du contexte.

L’initiative européenne pour l’égalité des langues (ELE), un projet pilote/une action préparatoire initiée par le Parlement européen, a élaboré un programme et une feuille de route pour parvenir à une égalité complète des langues numériques en Europe d’ici à 2030.

Dans le cadre du programme politique de la décennie numérique, la Commission coordonne un effort de l’Union dans l’ensemble des États membres et du secteur privé en vue de développer un écosystème européen de TL.

Enfin, la Commission reconnaît la valeur des données linguistiques comme fondement de la formation des modèles linguistiques par l’intermédiaire de l’espace européen commun de données linguistiques (LDS). Financé dans le cadre du programme de travail DIGITAL 2021-2022, le projet vise à déployer une plateforme et un marché pour la collecte, le partage et la réutilisation de données linguistiques multilingues et multimodales. Conformément à la stratégie européenne pour les données et au concept même d’ espaces de données, elle garantira que davantage de données linguistiques seront disponibles pour une utilisation dans l’économie, la société et la recherche, tout en gardant les entreprises et les individus qui génèrent les données sous contrôle.

Rassembler tous ces éléments, projets et acteurs est un défi majeur pour l’ Union, l’industrie européenne et les administrations publiques nationales — l’objectif ultime étant de soutenir la décennie numérique de l’Europe dans l’intérêt de tous.

Dernières nouvelles

Contenu associé

Vue d’ensemble

Intelligence artificielle

L’UE vise à mettre en place une intelligence artificielle (IA) digne de confiance qui accorde la priorité aux citoyens.

Aller plus loin

Technologies linguistiques et multilinguisme

L’UE soutient la recherche, l’innovation et le déploiement de technologies linguistiques pour éliminer les barrières linguistiques tout en préservant et en promouvant le multilinguisme.

À lire également

Usines d'IA

Les usines d’IA tirent parti de la capacité de supercalcul de l’entreprise commune EuroHPC pour développer des modèles d’IA générative de pointe fiables.

Bureau européen de l’IA

Le Bureau européen de l’IA est le centre d’expertise en matière d’IA dans l’ensemble de l’UE. Il joue un rôle clé dans la mise en œuvre de la législation sur l’IA – en particulier pour l’IA à usage général – en favorisant le développement et l’utilisation d’une IA digne de...

Robotique

L’UE encourage activement la recherche, la création d’emplois et l’innovation au moyen de robots de meilleure qualité et plus sûrs, tout en préservant les aspects éthiques des progrès réalisés.

Approche européenne de l’intelligence artificielle

L’approche de l’UE en matière d’intelligence artificielle est axée sur l’excellence et la confiance, dans le but de stimuler la recherche et les capacités industrielles tout en garantissant la sécurité et les droits fondamentaux.

Technologies linguistiques et multilinguisme

Inclusion numérique

L’inclusion numérique est un effort à l’échelle de l’UE visant à faire en sorte que chacun puisse...

Données

Les données sont partout et se développent à un rythme sans précédent. La Commission a élaboré une...