Comunicación presentada al III Congreso Ciudades Inteligentes:
Autores
- Antonio García Vázquez, Coordinador de Comunicación e Innovación de EPICSA, Diputación de Cádiz
- Raúl Díaz del Mazo, Coordinador de Proyectos, Viavansi
- Francisco Vázquez Cañas, Gerente de EPICSA, Diputación de Cádiz
Resumen
Migración de la plataforma de Datos Abiertos de la Diputación de Cádiz a una de código de fuentes abiertas basada en CKAN con una capa de presentación y visualización de datos basada en WordPress, inclusión de tecnología RTOD para la recolección automática de datos desde otros sistemas y backends institucionales, y cumplimiento de la normativa española sobre Reutilización de la Información del Sector Público (RISP) y su Norma Técnica de Interoperabilidad (NTI). La nueva plataforma de datos abierto, cuya dirección electrónica de referencia es https://datosabiertos.dipucadiz.es, ofrece conjuntos de datos de interés para reutilizadores, así como otros relacionados con las obligaciones de publicidad activa de la legislación en materia de transparencia.
Palabras clave
Datos Abiertos, Open Data, CKAN, Real Time Open Data (RTOD), Participación Ciudadana, Transparencia, Servicios al Ciudadano, Contenidos Digitales, Ciudades Inteligentes
Introducción
La Diputación de Cádiz ha puesto en marcha un portal de Gobierno Abierto en el que aglutina todas las iniciativas relacionadas con la transparencia, la apertura de datos y la participación ciudadana.
Concretamente en la sección de datos abiertos https://datosabiertos.dipucadiz.es, la Diputación de Cádiz, por la naturaleza de su actividad, tiene una gran cantidad de datos de interés a nivel provincial que pueden propiciar un importante activo para el desarrollo de nuevos productos y servicios, así como para la realización de estudios académicos y de mercado, y en definitiva, crear riqueza a través de acciones conjuntas de innovación entre ciudadanos, empresas y administraciones.
Entendiendo por tanto los datos en formatos abiertos como la materia prima del desarrollo de la Sociedad de la Información y la creación de nuevos servicios asociados a los mismos, en 2015 se comenzaron los trabajos de creación de un portal de datos abiertos de carácter provincial con objeto de que estos datos pudieran ser reutilizados y contribuir de esta forma al fortalecimiento del Sector TIC en su conjunto.
Inicialmente se articuló sobre una plataforma que permitió la rápida puesta en marcha de la estrategia de apertura de datos abiertos de la Diputación y sus entidades dependientes, pero entre otras limitaciones no cumplía con la con la normativa española sobre Reutilización de la Información del Sector Público (RISP) y su Norma Técnica de Interoperabilidad (NTI).
En 2016 iniciamos una nueva fase de la estrategia culminándose a nivel tecnológico en la migración a la plataforma OGoov, que utiliza como gestor de datos abiertos a CKAN para que se instale en el centro de proceso de datos de la Diputación ubicado en EPICSA, permitiendo tener el control total sobre la plataforma y además ofrecer este servicio a los ayuntamientos y entidades de la provincia que lo están solicitando, pues dicha plataforma de datos abiertos tiene carácter provincial y evita que cada entidad tenga que desplegar este tipo de plataformas.
Existía por tanto la necesidad de adaptarse a la legislación vigente (Real Decreto 1495/2011, de 24 de octubre y la Resolución de 19 de febrero de 2013, de la Secretaría de Estado de Administraciones Públicas, por la que se aprueba la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información), que buscan facilitar y garantizar el proceso de reutilización de la información de carácter público procedente de las Administraciones públicas, asegurando la persistencia de la información, el uso de formatos así como los términos y condiciones de uso adecuados.
Otra de las necesidades que se quería atender es la integración automática de la Infraestructura de Datos Espaciales de la provincia, IDECádiz, y otros sistemas y fuentes de datos provinciales.
El Proyecto
Objetivos
La estructura del texto principal deberá incluir, como referencia general, apartados tipo:
- Centralizar las iniciativas de apertura de institucionales en una sola plataforma provincial de datos abiertos.
- Ofrecer a todas las entidades de la provincia la posibilidad de publicar sus conjuntos de datos aprovechando la característica multientidad de la plataforma.
- Cumplimiento de la Norma Técnica de Interoperabilidad de Reutilización de Recursos de Información.
- Federación con los portales nacionales y europeo
- Integración automática con la Infraestructura de Datos Espaciales de Cádiz, IDE Cádiz.
- Publicación de los datos de la Encuesta Nacional de Infraestructuras.
- Contribuir al desarrollo del sector TIC de la provincia.
- Colaborar con la Escuela de Ingeniería de la UCA para potenciar su uso práctico.
- Conceptuar la plataforma como uno de los servicios transversales de proyectos Smart Cities que la Diputación ofrece a las entidades de la provincia.
Componentes
La plataforma está compuesta por varios componentes tecnológicos de fuentes abiertas que pasamos a describir a continuación. Con estos componentes en la plataforma se pueden cargar conjuntos de datos por personal con conocimientos básicos de ofimática con gran comodidad a la vez que se ofrece una interfaz potente para la visualización y análisis de los datos.
CKAN
El gestor del catálogo de datos (CKAN), el cual es respaldado por una amplia comunidad de usuarios y desarrolladores. Entre los casos de éxito más importantes que avalan su uso se encuentra el Portal de Datos Abiertos del Reino Unido , el de los Estados Unidos de América y en el Portal Europeo de Datos entre otros muchos.
WordPress
CKAN se enriquece con una capa de presentación soportada por el CMS (Sistema de Gestión de Contenidos) más conocido y usado del mercado, WordPress, con una interacción con el usuario muy sencilla y un soporte importantísimo de la comunidad.
Es verdad que una corriente ortodoxa del mundo de los Datos Abiertos insiste en exponerlos en crudo y que sean los reutilizadores los que los traten y transformen, ¿por qué no respetar esto pero permitiendo al ciudadano hacer operaciones básicas pero potentes sobre ellos como ordenarlos, filtrarlos por variados criterios o agruparlos a conveniencia y a partir de ahí elaborar vistosos gráficos o mapas que le permitan analizar y comprender mejor lo que significan? ¿o permitir a la propia entidad que los expone seleccionar de sus datos expuestos las mejores gráficas que los potencien e inviten a la reutilización?.
SPARQL
La plataforma dispone de un servidor semántico (Apache Marmotta) que permite dotarlo de capacidad de almacenamiento y gestión de datos semánticos y la publicación de un punto SPARQL para consultas semánticas.
Federable
Prácticamente todos los niveles institucionales tienen o tendrán en un futuro cercano portales de datos abiertos que pueden enriquecerse federando datos de portales de niveles inferiores.
La plataforma está preparada para generar el archivo necesario para que el Portal de Datos Abiertos pueda ser federado por cualquier portal regional, nacional o supranacional. En particular generamos un RDF/XML basado en el DCAT–NTI para federar con el portal de datos abiertos español (http://datos.gob.es) y a través del mismo en el portal europeo de datos (https://www.europeandataportal.eu/).
De igual forma, se genera un DCAT-AP (DCAT Application profile) que describe conjuntos de datos del sector público en Europa ampliando las posibilidades de federación.
Real Time Open Data (RTOD)
Real Time Open Data (RTOD) es un middleware que facilita el consumo de contenidos dinámicos alojados en diferentes sistemas proveedores a partir de un único punto de acceso.
En cualquier organización existe una gran heterogeneidad de sistemas, productos y back-ends cuya información es susceptible de ser publicada en el Portal de Gobierno Abierto / Datos Abiertos. Estos sistemas gestionan la información en estructuras y medios distintos, utilizando por un lado sus propios conjuntos de metadatos, normas para la estructuración y ordenación de los contenidos y por otro, distintos mecanismos para acceder a la información por parte de otros sistemas.
Por tanto, el principal problema que resuelve RTOD es la extracción automatizada de contenido de diferentes back-ends institucionales para incorporarlos a un catálogo de datos abiertos.
Actualización de contenidos
Actualmente RTOD ofrece diferentes alternativas para la extracción y actualización automatizada de contenidos mediante drivers.
Se conoce como driver RTOD aquella implementación que permite la comunicación entre el servidor RTOD y un proveedor de contenido (backend), de tal manera que la información disponible en el segundo pueda ser puesta a disposición de los sistemas interesados por el primero.
Actualmente RTOD dispone de drivers para los siguientes sistemas proveedores:
- SQL (MySQL, PostgreSQL, Oracle Database, Microsoft SQL Server y Microsoft Access)
- Rest (XML/JSON)
- FIWARE (Orion Context Broker)
- Ficheros Binarios (imágenes, formatos comprimidos, etc.)
Web semántica
Otra de las principales ventajas de RTOD es su capacidad de añadir semántica al contenido extraído de los proveedores. Esto es, RTOD es capaz de ofrecer el contenido de los proveedores en formatos con carga semántica como pueden ser RDF/XML, Turtle o N3 para su posterior almacenamiento en un Triplestore.
Reutilización
RTOD pone a disposición de los usuarios/reutilizadores una interfaz REST para la consulta de contenido.
La principal ventaja de esta interfaz es su capacidad de ofrecer el contenido en nueve serializaciones diferentes XML, RDF/XML, RDF/N3, RDF/TURTLE, JSON-LD, HTML, JSON, CSV y ATOM.
Explotación de la Encuesta Nacional de Infraestructuras
La Encuesta de Infraestructuras y Equipamientos Locales (EIEL) es un instrumento de análisis de los servicios de competencia municipal. Constituye un inventario de ámbito nacional que tiene como objetivo conocer periódicamente la situación y el nivel de dotación de infraestructuras y equipamientos locales, a fin de poder evaluar las necesidades de dichos sectores, permitir una correcta distribución de los recursos, eliminando los desequilibrios regionales mediante una mejor planificación de las inversiones públicas que la Administración Central y Local realiza en los municipios.
Está regulada por el Real Decreto 835/2003, de 27 de junio, por el que se reglamenta la cooperación económica del Estado a las inversiones de las entidades locales y por la Orden APU/293/2006, de 31 de enero, de desarrollo del mencionado Real Decreto.
Las diputaciones provinciales son las encargadas de elaborar la EIEL para los municipios menores de 50.000 habitantes, contando con la colaboración técnica y económica del Ministerio de Hacienda y Administraciones Públicas.
Se ha realizado una migración de los datos de la encuesta a la Infraestructura de Datos Espaciales de la Diputación IDE Cádiz y de ahí, vía RTOD, se ofrecerán todos los conjuntos de datos en formatos reutilizables en la plataforma.
Conclusiones
El Portal de Datos Abiertos de la Diputación de Cádiz cuenta en la actualidad con 22 conjuntos de datos y 69 distribuciones, pero esperamos que durante el presente año podamos ampliar la cantidad y calidad de los conjuntos de datos mediante el aprovechamiento de la funcionalidad RTOD de la plataforma.
Aunque la apertura de datos públicos aún no cuenta con una gran acogida en la provincia de Cádiz, pretendemos con este proyecto ir avanzando en el conocimiento del paradigma entre los actores sociales involucrados, principalmente de la Universidad de Cádiz con la que tenemos previsto iniciar acciones de colaboración, e ir progresivamente publicando todas aquellas fuentes de datos de mayor interés público con el objetivo de crear servicios y valor basados en la reutilización de los datos publicados.
También esperamos que la plataforma de datos abiertos contribuya de manera decisiva en la estrategia provincial de Smart Región conceptuándose como uno de los sistemas horizontales de servicios y plataformas smart que la Diputación tiene previsto desplegar con la colaboración de otras instituciones.
Agradecimientos
Nuestro más profundo agradecimiento al impulso y coordinación de la Presidenta de la Diputación Provincial de Cádiz, Irene García Macías, a la Diputada Delegada de Sociedad de la Información, Elena Amaya León, y al Director del Área de Coordinación Política, Juan Carlos Perales Pizarro.
A la dirección de EPICSA y a todo el personal técnico involucrado, pero destacar de manera especial el trabajo de Antonio Galán Obregón, Antonio Ureba Basallote y Pedro Mandado Serantes.
Y por supuesto, este proyecto no hubiera sido posible sin la colaboración tecnológica de la empresa sevillana Viavansi, a la que agradecemos su dedicación tanto a la dirección de la empresa como todos los trabajadores involucrados en el proyecto.