Las tecnologías lingüísticas están abriendo la puerta de entrada a una Europa más conectada, innovadora y accesible.
Las tecnologías del lenguaje (LT) permiten a las máquinas no solo leer, analizar, procesar y generar lenguaje humano, sino también, gracias a los avances científicos recientes, cerrar la brecha entre la comunicación humana y la comprensión de la máquina.
Dado que el lenguaje sirve como el medio fundamental para la interacción humana, LT ha ganado una gran importancia en varias industrias y aplicaciones, desde la traducción y la localización hasta el soporte al cliente, la atención médica, la creación de medios y el marketing. Ejemplos comunes de esta tecnología son el reconocimiento de voz, asistentes inteligentes, traducción automática, chatbots, resumen de texto y subtitulado automático.
¿Qué se necesita para desarrollar las tecnologías lingüísticas?
A continuación se presentan algunos de los elementos clave para desarrollar herramientas y servicios basados en el lenguaje.
- Datos lingüísticos: esto se refiere al contenido textual o hablado, en uno o más idiomas, que sirve como entrada o material de capacitación para tareas de procesamiento de lenguaje natural, por ejemplo, generación de texto o análisis de sentimientos. Estos datos pueden provenir de una variedad de fuentes: libros, artículos, publicaciones en redes sociales, transcripciones de conversaciones habladas, etc. Dado que constituye la base del desarrollo de LT, es vital que se recopilen respetando plenamente las disposiciones sobre derechos de autor (DPI) y protección de datos personales (RGPD).
- Algoritmos de formación y modelos lingüísticos: los algoritmos son el software, las «recetas», para crear modelos de lenguajes humanos. Con cantidades sustanciales de datos de calidad, los últimos algoritmos de Machine Learning han mostrado mayores capacidades para crear modelos que representen el conocimiento derivado de los datos del lenguaje. Cuanto más grandes sean los recursos y modelos, más abarcadores y genéricos son sus aplicaciones.
- Potencia computacional: se requieren recursos computacionales significativos, especialmente durante la creación de modelos de lenguaje, donde la computación de alto rendimiento y las infraestructuras de nube robustas son cruciales.
- Experiencia humana: el éxito de LT implica la colaboración entre lingüistas, científicos de datos, ingenieros informáticos y especialistas en dominios.
¿Qué está haciendo Europa para desarrollar las tecnologías lingüísticas?
En Europa, tenemos un paisaje lingüístico complejo. La Carta de los Derechos Fundamentales de la Unión Europea prohíbe la discriminación por razón de la lengua y obliga a la UE a respetar la diversidad lingüística. La rendición de cuentas, la transparencia, la equidad y el respeto de nuestros valores son solo algunas de sus implicaciones éticas. Estos derechos y principios solo pueden garantizarse mediante un uso imparcial de LT.
La industria europea de las LT desempeña un papel clave en la autonomía estratégica y tecnológica de Europa, que debe reforzarse aún más. Nuestras necesidades específicas del mercado son más conocidas por los roviders europeos LT p, de los cuales cientos se enumeran en el Catálogo de Servicios de eTranslation.
Las soluciones disponibles al público, incluidas lasherramientas y los servicios ofrecidos por la Comisión Europea, complementan la oferta de mercado al tiempo que abordan una deficiencia en el apoyo tecnológico a las lenguas de escasos recursos. Estas soluciones básicas —traducción automática (eTranslation), denominadas reconocimiento de entidades, resumen, transcripción de discursos y seudonimización de datos para el cumplimiento del RGPD- están disponibles para todas las administraciones públicas europeas y las pequeñas y medianas empresas en todas las lenguas oficiales.
En el marco de Horizonte 2020, la Red Europea de Lenguas (ELG) creó una ventanilla única de soluciones especializadas en LT. Los esfuerzos de difusión y construcción de comunidades han contribuido a fomentar un entendimiento común sobre la necesidad de unirse a las fuerzas públicas y privadas y beneficiarse de lo mejor de ambos mundos en la investigación y el despliegue.
El programa Horizonte Europa fomenta la investigación y la innovación a través del apoyo al desarrollo de LT más allá de la tecnología avanzada, incluidos los modelos de grandes lenguas. Estos modelos, diseñados para mejorar la interacción humano-máquina, tendrán capacidades multilingües, manejarán múltiples modos de entrada, manejarán sesgos y exhibirán conciencia del contexto.
La iniciativa «Igualdad de las Lenguas Europeas», un proyecto piloto/acción preparatoria iniciado por el Parlamento Europeo, elaboró una agenda y una hoja de ruta para lograr la plena igualdad lingüística digital en Europa de aquí a 2030.
En el marco del Programa de Política para la Década Digital, la Comisión está coordinando un esfuerzo de la Unión entre los Estados miembros y el sector privado para desarrollar un ecosistema europeo de LT.
Por último, la Comisión reconoce el valor de los datos lingüísticos como base para la formación de modelos lingüísticos a través del Espacio Común Europeo de Datos Lingüísticos (LDS). Financiado en el marco del programa de trabajo DIGITAL 2021-2022, el proyecto tiene como objetivo desplegar una plataforma y un mercado para la recopilación, el intercambio y la reutilización de datos lingüísticos multilingües y multimodales. En consonancia con la Estrategia Europea de Datos y el concepto mismo de Espacios de Datos, garantizará que se disponga de más datos lingüísticos para su uso en la economía, la sociedad y la investigación, manteniendo al mismo tiempo a las empresas y las personas que generan los datos en control.
Reunir todos estos elementos, proyectos y actores es un reto importante para la Unión, la industria europea y las administraciones públicas nacionales, cuyo objetivo último es apoyar la Década Digital de Europa en beneficio de todos.
Últimas noticias
Contenidos relacionados
Visión general
En detalle
-
La UE apoya la investigación, la innovación y el despliegue de tecnologías lingüísticas para romper las barreras lingüísticas, preservando y promoviendo al mismo tiempo el multilingüismo.
Tecnologías del lenguaje y multilingüismo
La inclusión digital es un esfuerzo a escala de la UE para garantizar que todos puedan contribuir al...
Los datos están en todas partes y están creciendo a un ritmo sin precedentes. La Comisión ha...