Skip to main content
Configurar el futuro digital de Europa

Tecnologías lingüísticas

Las tecnologías lingüísticas están abriendo la puerta de entrada a una Europa más conectada, innovadora y accesible.

    Representación visual del lenguaje y las tecnologías: una elección de enchufes para conectar un cable, cada uno representado por una bandera

©Getty Images/iStock

Las tecnologías del lenguaje (LT) permiten a las máquinas no solo leer, analizar, procesar y generar lenguaje humano, sino también, gracias a los avances científicos recientes, cerrar la brecha entre la comunicación humana y la comprensión de la máquina.

Dado que el lenguaje sirve como el medio fundamental para la interacción humana, LT ha ganado una gran importancia en varias industrias y aplicaciones, desde la traducción y la localización hasta el soporte al cliente, la atención médica, la creación de medios y el marketing. Ejemplos comunes de esta tecnología son el reconocimiento de voz, asistentes inteligentes, traducción automática, chatbots, resumen de texto y subtitulado automático.

¿Qué se necesita para desarrollar las tecnologías lingüísticas?

A continuación se presentan algunos de los elementos clave para desarrollar herramientas y servicios basados en el lenguaje.

  • Datos lingüísticos: esto se refiere al contenido textual o hablado, en uno o más idiomas, que sirve como entrada o material de capacitación para tareas de procesamiento de lenguaje natural, por ejemplo, generación de texto o análisis de sentimientos. Estos datos pueden provenir de una variedad de fuentes: libros, artículos, publicaciones en redes sociales, transcripciones de conversaciones habladas, etc. Dado que constituye la base del desarrollo de LT, es vital que se recopilen respetando plenamente las disposiciones sobre derechos de autor (DPI) y protección de datos personales (RGPD).
  • Algoritmos de formación y modelos lingüísticos: los algoritmos son el software, las «recetas», para crear modelos de lenguajes humanos. Con cantidades sustanciales de datos de calidad, los últimos algoritmos de Machine Learning han mostrado mayores capacidades para crear modelos que representen el conocimiento derivado de los datos del lenguaje. Cuanto más grandes sean los recursos y modelos, más abarcadores y genéricos son sus aplicaciones.
  • Potencia computacional: se requieren recursos computacionales significativos, especialmente durante la creación de modelos de lenguaje, donde la computación de alto rendimiento y las infraestructuras de nube robustas son cruciales.
  • Experiencia humana: el éxito de LT implica la colaboración entre lingüistas, científicos de datos, ingenieros informáticos y especialistas en dominios.

¿Qué está haciendo Europa para desarrollar las tecnologías lingüísticas?

En Europa, tenemos un paisaje lingüístico complejo. La Carta de los Derechos Fundamentales de la Unión Europea prohíbe la discriminación por razón de la lengua y obliga a la UE a respetar la diversidad lingüística. La rendición de cuentas, la transparencia, la equidad y el respeto de nuestros valores son solo algunas de sus implicaciones éticas. Estos derechos y principios solo pueden garantizarse mediante un uso imparcial de LT.

La industria europea de las LT desempeña un papel clave en la autonomía estratégica y tecnológica de Europa, que debe reforzarse aún más. Nuestras necesidades específicas del mercado son más conocidas por los roviders europeos LT p, de los cuales cientos se enumeran en el Catálogo de Servicios de eTranslation.

Las soluciones disponibles al público, incluidas lasherramientas y los servicios ofrecidos por la Comisión Europea, complementan la oferta de mercado al tiempo que abordan una deficiencia en el apoyo tecnológico a las lenguas de escasos recursos. Estas soluciones básicas —traducción automática (eTranslation), denominadas reconocimiento de entidades, resumen, transcripción de discursos y seudonimización de datos para el cumplimiento del RGPD- están disponibles para todas las administraciones públicas europeas y las pequeñas y medianas empresas en todas las lenguas oficiales.

En el marco de Horizonte 2020, la Red Europea de Lenguas (ELG) creó una ventanilla única de soluciones especializadas en LT. Los esfuerzos de difusión y construcción de comunidades han contribuido a fomentar un entendimiento común sobre la necesidad de unirse a las fuerzas públicas y privadas y beneficiarse de lo mejor de ambos mundos en la investigación y el despliegue.

El programa Horizonte Europa fomenta la investigación y la innovación a través del apoyo al desarrollo de LT más allá de la tecnología avanzada, incluidos los modelos de grandes lenguas. Estos modelos, diseñados para mejorar la interacción humano-máquina, tendrán capacidades multilingües, manejarán múltiples modos de entrada, manejarán sesgos y exhibirán conciencia del contexto.

La iniciativa «Igualdad de las Lenguas Europeas», un proyecto piloto/acción preparatoria iniciado por el Parlamento Europeo, elaboró una agenda y una hoja de ruta para lograr la plena igualdad lingüística digital en Europa de aquí a 2030.

En el marco del Programa de Política para la Década Digital, la Comisión está coordinando un esfuerzo de la Unión entre los Estados miembros y el sector privado para desarrollar un ecosistema europeo de LT.

Por último, la Comisión reconoce el valor de los datos lingüísticos como base para la formación de modelos lingüísticos a través del Espacio Común Europeo de Datos Lingüísticos (LDS). Financiado en el marco del programa de trabajo DIGITAL 2021-2022, el proyecto tiene como objetivo desplegar una plataforma y un mercado para la recopilación, el intercambio y la reutilización de datos lingüísticos multilingües y multimodales. En consonancia con la Estrategia Europea de Datos y el concepto mismo de Espacios de Datos, garantizará que se disponga de más datos lingüísticos para su uso en la economía, la sociedad y la investigación, manteniendo al mismo tiempo a las empresas y las personas que generan los datos en control.

Reunir todos estos elementos, proyectos y actores es un reto importante para la Unión, la industria europea y las administraciones públicas nacionales, cuyo objetivo último es apoyar la Década Digital de Europa en beneficio de todos.

Últimas noticias

Contenidos relacionados

Visión general

Inteligencia artificial

La UE tiene como objetivo construir una inteligencia artificial (IA) fiable que ponga a las personas en primer lugar.

En detalle

Tecnologías del lenguaje y multilingüismo

La UE apoya la investigación, la innovación y el despliegue de tecnologías lingüísticas para romper las barreras lingüísticas, preservando y promoviendo el multilingüismo.

Véase también

Fábricas de IA

Las fábricas de IA aprovechan la capacidad de supercomputación de la Empresa Común EuroHPC para desarrollar modelos de IA generativos fiables y de vanguardia.

Oficina Europea de IA

La Oficina Europea de IA será el centro de la experiencia en IA en toda la UE. Desempeñará un papel clave en la aplicación de la Ley de IA, especialmente para la IA de propósito general, fomentará el desarrollo y el uso de IA confiable y la cooperación internacional.

Robótica

La UE promueve activamente la investigación, la creación de empleo y la innovación a través de robots mejores y más seguros, salvaguardando al mismo tiempo los aspectos éticos de los avances logrados.

Enfoque europeo de la inteligencia artificial

El enfoque de la UE con respecto a la inteligencia artificial se centra en la excelencia y la confianza, con el objetivo de impulsar la investigación y la capacidad industrial, garantizando al mismo tiempo la seguridad y los derechos fundamentales.

Tecnologías del lenguaje y multilingüismo

Inclusión digital

La inclusión digital es un esfuerzo a escala de la UE para garantizar que todo el mundo pueda...

Datos

Los datos están en todas partes y están creciendo a un ritmo sin precedentes. La Comisión ha...