La Comisión Europea ha anunciado el lanzamiento del Consorcio de Infraestructura Digital Europea de la Alianza para las Tecnologías del Lenguaje (ALT-EDIC) y del Espacio de Datos Lingüísticos (LDS). El objetivo de estas iniciativas es abordar la escasez de datos lingüísticos europeos necesarios para entrenar grandes modelos de inteligencia artificial (IA) multilingües en la Unión Europea.

Constituido en febrero de 2024, el ALT-EDIC reúne a 17 Estados miembros participantes y a otros nueve países y regiones en calidad de observadores. Por su parte, el LDS, enmarcado en los espacios comunes europeos de datos, pretende aumentar la disponibilidad de datos para el desarrollo de la IA en Europa.
Desarrollado por la Comisión Europea y financiado a través del programa Europa Digital, el LDS busca establecer un mercado unificado para datos lingüísticos, mejorando la recopilación y el intercambio de datos multilingües para respaldar los grandes modelos lingüísticos europeos. En un inicio pueden acceder las instituciones y empresas seleccionadas, aunque la iniciativa pretende involucrar a todos los actores públicos y privados europeos.
Apoyar la diversidad lingüística y cultural en la IA
Al ofrecer servicios en todos los idiomas de la Unión Europea, ambas iniciativas están orientadas a superar las barreras lingüísticas y ofrecer soluciones mejores y más accesibles para las pequeñas empresas europeas.
Estos esfuerzos no solo buscan preservar el rico patrimonio cultural y lingüístico de Europa en la era digital, sino también reforzar la soberanía tecnológica de la UE.