El proyecto europeo BigEarth (Accurate and Scalable Processing of Big Data in Earth Observation), que se ha desarrollado entre abril de 2018 y julio de 2024, ha creado nuevos métodos, enfoques y herramientas basadas en inteligencia artificial (IA) para extraer información de los archivos de datos obtenidos vía satélite que se recopilan con el objetivo de aprovecharlos mejor, especialmente en áreas como los servicios de emergencia y la predicción meteorológica. Estos resultados han sido publicados por el Servicio de Información Comunitario sobre Investigación y Desarrollo (Cordis) de la Unión Europea.
En los últimos años, se ha lanzado una gran cantidad de satélites de observación de la Tierra y los avances han aumentado la cantidad, variedad y resolución espacial/espectral de los datos. Esto ha convertido en un desafío la extracción y recuperación de información útil de archivos masivos de datos con una gran cantidad de imágenes de teledetección.
El programa de observación de la Tierra de la Unión Europea, Copernicus, proporciona información procedente de satélites y datos no espaciales in situ, que resultan de gran utilidad para elaborar las previsiones meteorológicas, dar respuesta a las catástrofes naturales y para la agricultura. Dentro de este servicio, la familia de satélites Sentinel realiza tareas específicas de vigilancia terrestre, atmosférica y oceánica. Toda la información recabada es gratuita y de acceso libre para los usuarios, sin embargo, puede ser difícil de navegar debido a la gran cantidad de datos.
En este contexto, el proyecto BigEarth ha trabajado en el desarrollo de métodos y herramientas innovadoras con el objetivo de caracterizar y explotar el contenido semántico de alto nivel y la información espectral presente en las imágenes de teledetección, extraer características directamente de las imágenes comprimidas, lograr la indexación y recuperación de imágenes precisas y escalables, y unificar la representación de características.
Dirigido por la profesora Begüm Demir de la Facultad de Ingeniería Eléctrica y Ciencias de la Computación de la Universidad Técnica de Berlín, BigEarth ha sido financiado por el Consejo Europeo de Investigación con 1.491.479 euros a través del programa Horizonte 2020.
Análisis de datos de observación de la Tierra
Entre los hitos del proyecto, en 2019 hizo público un gran archivo de teledetección, BigEarthNet, para avanzar en la investigación en análisis de archivos de imágenes de teledetección a gran escala.
Al año siguiente, se lanzaron los modelos de deep learning entrenados en el marco del proyecto y un desarrollo posterior de la Dirección General del Territorio de Lisboa y la Universidad Técnica de Berlín permitió que estos modelos aprendiesen y describiesen mejor el contenido complejo de información espacial/espectral de las imágenes de Sentinel-2 en BigEarthNet. También en 2020 se publicaron los códigos desarrollados y BigEarthNet se enriqueció con la inclusión de imágenes de Sentinel-1 para respaldar la investigación sobre clasificación, recuperación y búsqueda de imágenes multimodales/intermodales.
En 2021 se hicieron públicos los códigos de modelos de deep learning resistentes a variaciones o distorsiones no deseadas para la observación de la Tierra. Además, el año pasado se lanzó un conjunto de datos de referencia hiperespectrales a gran escala obtenidos por el satélite EnMAP.
Por último, este año se organizó un taller para explorar los métodos, enfoques y sistemas emergentes en el contexto de la gestión de datos y el aprendizaje automático para la observación de la Tierra, llegando el proyecto a su fin el pasado mes de julio.
Buscar a través de imágenes en archivos de datos satelitales
Así, el proyecto BigEarth se ha centrado en la creación de métodos de búsqueda de datos más modulables para encontrar información útil en archivos de datos satelitales en constante crecimiento en volumen y diversidad.
Uno de los principales resultados consiste en el desarrollo de un enfoque basado en el uso de imágenes para buscar información específica mediante modelos de aprendizaje automático que permiten analizar datos satelitales a gran escala. Se han desarrollado algoritmos para analizar, modelizar y recuperar datos de archivos masivos de forma modulable, de manera que sea una técnica fácil de usar y accesible a investigadores de diversas disciplinas.
En la práctica, este enfoque puede ayudar a numerosos usuarios finales, desde servicios de rescate, búsqueda y salvamento hasta científicos especializados en clima. Por ejemplo, permite introducir una imagen de un incendio forestal para buscar en la base de datos sucesos similares y detectarlos lo antes posible.
Otro uso potencial es la búsqueda de un mineral específico, que podría estar oculto en los archivos de datos satelitales. Consultar a través de una imagen puede ayudar a localizar exactamente en qué parte del planeta se puede encontrar un mineral, pues los datos recuperados están geolocalizados y llevan un sello de tiempo.
Motor de búsqueda de BigEarth
En paralelo, BigEarth puso en marcha un proyecto para crear un prototipo de motor de búsqueda viable, que se presentó a agencias espaciales como la Agencia Espacial Europea, para que puedan aprovechar los conocimientos de los trabajos desarrollados y añadir la herramienta a sus servicios.
El objetivo último del equipo de BigEarth es permitir a los usuarios finales navegar mejor por la gran cantidad de datos satelitales disponibles y encontrar lo que buscan con rapidez y eficacia. De esta manera, los meteorólogos podrán predecir con mayor exactitud los patrones meteorológicos y los oceanógrafos serán capaces de trazar los cambios de temperatura del mar. Asimismo, puede ayudar a cartografiar con precisión hábitats y procesos como la deforestación.
De cara al futuro, está previsto que el concepto de motor de búsqueda de BigEarth -con consultas basadas en imágenes para mejorar la experiencia de usuario- se incorpore al ecosistema de datos espaciales de Copernicus, que pone a disposición del público los datos de los satélites Sentinel en una plataforma en la nube de libre acceso.