Comunicación presentada al VI Congreso Ciudades Inteligentes
Autores
- Carlos Gonzalez Luis, Socio, Grant Thornton
- Enrique Serrano, CEO, Tinámica
- Maite Gilarranz, Co-Fundadora, Piperlab
- Manuel Gago, Presidente, NEO
Resumen
CitizenLab es un laboratorio experimental de datos de fuentes abiertas y anonimizadas, que pretende poner en valor el poder de los datos en la mejora de los servicios públicos. Para ello se crearán, mediante la analítica avanzada y la inteligencia artificial (IA) aplicada a patrones de comportamiento ciudadano, modelos predictivos que permitan generar nuevos modelos de negocio y una mejora en el diseño y la calidad de los servicios públicos. El proyecto persigue mejorar los servicios al ciudadano partiendo de los datos que proporciona sobre su comportamiento individual y colectivo, mediante la predicción del impacto y uso que el ciudadano hace de cuatro sectores clave: automoción y movilidad, sanitario, infraestructuras y turismo. El objetivo último será el estímulo económico de una región a través de nuevas empresas basadas en la economía de los datos, la mejora de la calidad de los servicios públicos haciéndolos proactivos y personalizados, y la definición de algoritmos predictivos que permitan simular escenarios que apoyen la toma de decisiones en materia de políticas públicas.
Palabras clave
Inteligencia Artificial, Big Data, Patrones de Comportamiento, Predicción, Servicios Proactivos, Ciudadanos
Introducción: Proyecto CitizenLab
CitizenLab es un proyecto innovador de análisis de datos a partir de modelos predictivos de comportamiento ciudadano, que creará nuevos modelos de negocio con ese ciudadano como principal beneficiado y con el objetivo de potenciar económicamente la región con nuevas empresas y mejorar la calidad de los servicios públicos, proporcionando a las entidades públicas y territorios inteligentes una herramienta para la toma de decisiones e información para mejorar la definición de los servicios que pone a disposición de los ciudadanos.
Este proyecto experimental basado en la fuerza del dato propondrá las mejores soluciones para el ciudadano, contando con la tecnología de vanguardia adecuada en cada caso.
Se trata de un entorno de experimentación pionero que aplicará metodologías que evaluarán los patrones de comportamiento de los ciudadanos en relación con el uso que hagan de los siguientes sectores: automoción y movilidad, sanitario, infraestructuras y turismo, sin perjuicio de que otros sectores y áreas de interés se vayan incorporando a lo largo del proyecto. En este sentido, se estudiarán sus hábitos de consumo, demandas de movilidad, estado de salud y necesidades de las distintas infraestructuras y medios físicos.
Una vez recogida toda esta información Big Data con los movimientos demográficos ciudadanos más importantes en las zonas estudiadas, los equipos de trabajo de las empresas del consorcio con el apoyo de las universidades implicadas, desarrollarán soluciones de negocio integradas basadas en algoritmos, que serán útiles tanto para las administraciones públicas, como para los propios ciudadanos, como para empresas que deseen desarrollar soluciones innovadoras según la información predictiva obtenida. Esto redundará, por ejemplo, en mejoras tangibles para el ciudadano como la fluidez del tráfico, la mejora de la calidad aire, la reducción de listas de espera en la Sanidad, etc.
El objetivo último de CitizenLab será favorecer el desarrollo económico de los territorios mediante núcleos colaborativos de innovación público-privada, que aumenten la inversión empresarial en I+D+i y fomenten ecosistemas de emprendimiento. Además, se estimulará la creación y consolidación de nuevas empresas y modelos de negocio basados en los datos generados por el proyecto.
El aprovechamiento de los datos provenientes de fuentes de datos abiertas facilitará la sostenibilidad del modelo y el fomento de la economía del dato, así como administraciones cuya toma de decisiones se basa en los datos.
Descripción del proyecto
CitizenLab estudiará los datos que generan los ciudadanos, en un primer momento en los cuatro sectores elegidos (automoción y movilidad, sanitario, infraestructuras y turismo), y propondrá soluciones específicas de negocio, que aplicarán la tecnología que mejor se ajuste a los modelos predictivos. Comenzará analizando la situación de las tendencias y retos tecnológicos de cada sector, para después recopilar otras variables y fuentes de información, como las generadas por las propias empresas y clientes que interactúan en esos ecosistemas, o las barreras existentes en los mismos.
A continuación, se pasará a la fase de patrones de comportamiento, en la que se identificarán las fuentes de datos abiertos que son públicos y accesibles, se procederá a la extracción de esos datos y se validarán y modelizarán mediante técnicas de Data Science, que tiene en cuenta variables tendenciales y medioambientales para una mejor optimización del dato obtenido.
En la fase final, y con el ciudadano/individuo como cliente central, se definirán, según la arquitectura de algoritmos predictivos obtenida, modelos innovadores relacionales y de negocio a desarrollar y explotar. Esto creará un porfolio de soluciones de futuro bajo demanda, para todas las empresas y ciudadanos interesados en los sectores y ecosistemas analizados, así como la obtención de desarrollos adhoc.
Además del análisis predictivo que permita la mejora de servicios al ciudadano por cada uno de los sectores, el modelo permitirá tener en cuenta las variables de más de un sector conjuntamente, analizando aspectos que puedan influir sobre más de un sector, obteniendo escenarios para la evaluación de políticas públicas o para la puesta a disposición de nuevos modelos de negocio de datos de interés procesados.
El consorcio que desarrolla el proyecto está liderado por la consultora de servicios profesionales Grant Thornton, y compuesto por tres pymes especializadas en la analítica de datos en diversos sectores, como son, Piperlab, Tinámica y NEO; el consorcio cuenta con la colaboración con el Departamento de Ciencias de la Computación de la Universidad de Alcalá de Henares y la Cátedra del Departamento de Ciencias de la Computación, Arquitectura de Computadores., Lenguajes y Sistemas Informáticos. y Estadística e Investigación Operativa de la Universidad Rey Juan Carlos. El proyecto tiene una duración de cuatro años y cuenta con un presupuesto de 8 millones de euros, cofinanciado por la Comunidad de Madrid y por fondos FEDER.
Objetivos específicos
Los objetivos específicos que plantea este proyecto son los siguientes:
- Generar un modelo predictivo que basado en un conjunto de conceptos previamente establecidos genere una variedad de escenarios probables que permitan la adaptación de la oferta de servicios de salud, su presupuestación y la modificación y programación de las infraestructuras necesarias, necesidades de personal y su cualificación.
Se trata de desarrollar una base de datos explotable, con patrones de comportamiento e indicadores propios del sector, para poder predecir crecimientos en la demanda de determinados servicios y por consiguiente el personal sanitario y las infraestructuras necesarias en las zonas definidas y extrapolables a zonas de características similares. Dichos parámetros irán unidos a la presupuestación de los servicios para la consecución de un nivel de satisfacción establecido e irá unido al resto de objetivos específicos definidos con alto grado de relación con el presente.
- Generar una serie de conceptos que unidos a una nueva metodología de evaluación de la demanda de movilidad permita establecer un modelo avanzado de predicción de la demanda de transporte. Desarrollando una metodología de predicción de la demanda de transporte asociada a los hábitos de los ciudadanos y contemplando las distintas tipologías de transporte y la intermodalidad entre las mismas para la potencialización de las zonas objeto del proyecto. Dentro de las tipologías de transporte en estudio se encontrarán tanto los medios públicos como las distintas posibilidades de transporte privado existentes actualmente dentro de las que se incluyen los modelos de Car Sharing y demás modalidades. La demanda se estudiará a nivel estacional, teniéndose en cuenta los picos de movilidad a nivel diario como anual y según tipologías de consumidor target del proyecto.
- Avanzar en nuevos conceptos que describan los mecanismos de explotación turística y que permitan establecer una metodología integradora para la estimación prospectiva de un modelo de oferta-demanda que represente escenarios turísticos futuros. El proyecto desarrollará un marco de análisis de los patrones de oferta y demanda dentro del sector turístico para poder así determinar curvas de demanda dentro del sector y de la diversidad de servicios que ofrece como pueden ser los hoteles, albergues, campings o apartamentos vacacionales entre otros. Dicho análisis tendrá mucho que ver con los desarrollados previamente y centrado en el mismo público objetivo. Se demostrará que visto que los patrones de movilidad condicional los movimientos demográficos y turísticos así como las corrientes de hábitos saludables o relacionadas con medios de transporte y facilidad de acceso a los mismos.
- Desarrollar un modelo de predicción de elasticidades en la curva de oferta-demanda de movilidad dentro de las infraestructuras que ayude a establecer nuevas metodologías de modulación de la oferta y su previsible evolución. Se definirá una metodología de análisis de las distintas infraestructuras intervinientes en la movilidad de los ciudadanos y de los sistemas que gestionan las mismas como pueden ser parkings públicos y peajes intra o fuera de la zona de Madrid determinada como alcance del proyecto. Con la información y los patrones definidos se podrá desarrollar un modelo de transporte sostenible que tendrá en cuenta las curvas de demanda y oferta de transporte según los parámetros previamente definidos y así poder, entre otros, aplicar técnicas de discriminación de precios a las infraestructuras del transporte para así solventar problemas de colapso y aportan el mayor excedente al consumidor objeto del proyecto.
- Generar un entorno tecnológico flexible y operable por el no-técnico que permita la usabilidad y posterior desarrollo de los modelos predictivos. Se definirá y desarrollará un entorno tecnológico que permita la utilización efectiva y eficiente, de la información generada y definida en las fases anteriores, para así poder desarrollar predicciones y rutinas que permitan la mayor satisfacción del ciudadano en sus movimientos demográficos y el desarrollo de esta zona geográfica elegida con unas bases científicas objetivas definidas por expertos de las distintas disciplinas. Dicho sistema será flexible y abierto, y con altas capacidades de escalabilidad, además será capaz de procesar altos volúmenes de información mediante algoritmos complejos que cruzarán información de distintos ámbitos para así obtener hallazgos imposibles sin un sistema de dicha naturaleza.
Sectores de análisis
Cada una de las industrias o sectores que están incluidas en el proyecto CitizenLab tienen retos tecnológicos que, por supuesto, serán objeto de estudio con el fin de hallar modelos que, en última instancia, beneficien a los ciudadanos. Algunos de los retos planteados por el proyecto para cada sector son los siguientes:
Por ejemplo, en el ecosistema de Automoción y Movilidad, se analizarán datos de movilidad para elaborar planes óptimos de restricciones de movilidad por zonas, planes de contaminación, mejora de la circulación; el estudio de los datos en materia de flujos de movilidad arrojará nuevas soluciones sobre movilidad compartida, necesidades de infraestructuras, u optimización de las rutas de transporte público. Este patrón de análisis, en definitiva, se aplicará también en la definición de los nuevos conceptos de ciudad, garantizando la accesibilidad a los servicios públicos necesarios, aportando una nueva configuración de las ciudades basadas en la calidad de vida y dinamismo de la ciudad.
En cuanto al sector sanitario, los análisis de Big Data en este sector se aplicarán sobre medicina predictiva, medicina de precisión, oncología, hospitalización a domicilio, datos de logística farmacéutica e incluso datos sobre el envejecimiento activo, que permitirán recomendar más ejercicio físico a los ciudadanos, mejor alimentación o nuevos fármacos; los datos sobre enfermedades crónicas también permitirán prevenir el consumo de alcohol y tabaco o mejorar la capacidad asistencial hospitalaria de un área de referencia.
El uso que los ciudadanos hacen de las infraestructuras también se verá optimizado gracias al análisis de datos sobre accesibilidad, tarifas y usuarios del transporte, estado físico de las infraestructuras, digitalización del sector y eficiencia operativa y ambiental. Esto permitirá encontrar nuevas soluciones de negocio para las infraestructuras ferroviarias, para su tráfico rodante y para la dotación de nuevas infraestructuras que necesite la región.
Por último, dentro de este primer análisis, los turistas que nos visitan y los ciudadanos que viajan al exterior también generan datos que permitirán estudiar qué tipos de emplazamientos prefieren en sus viajes, los lugares más visitados y la frecuencia y los medios de transporte para llegar a esos destinos. En definitiva, los modelos centrados en el turista propuestos por CitizenLab, permitirán crear nuevas experiencias de usuario turístico más personalizadas y que respondan a las preferencias únicas expresadas por ese propio usuario de la red turística de un territorio.
Elementos innovadores del proyecto
Los grandes avances tecnológicos nos permitirán el procesamiento de información desestructurada y la obtención de correlaciones entre datos procedentes de distintos sectores. El motor de análisis y los algoritmos relacionales permitirán desarrollar previsiones de demanda basadas en distintos parámetros y hallazgos los cuales serán descubiertos por los distintos equipos de expertos unidos a la cantidad ingente de datos que se aglutinarán en la plataforma.
El desarrollo de esta herramienta innovadora tanto por su aplicación para la mejora de los servicios públicos como por la definición de casos de uso y el análisis de la correlación entre diferentes sectores. Es por todo ello que este proyecto, aun enmarcándose dentro del ámbito de la analítica de datos que es un ámbito maduro dentro de la técnica, supone un elemento innovador por su configuración de los datos, las técnicas de analítica aplicada, los algoritmos a desarrollar para el cruce de sectores y el planteamiento de los casos de uso para su aplicación práctica.
Metodología
El desarrollo del proyecto se ha dividido en seis paquetes de trabajo, los cuatro primeros paquetes son los relativos a los análisis sectoriales, el quinto paquete se centra en la tecnología y la prueba piloto, y el último se enfoca en la comunicación y difusión de los avances del proyecto. Para cada uno de los paquetes de trabajo sectoriales se desarrollarán las siguientes tareas:
- Análisis del Estado del arte en cada sector
Para la definición del modelo predictivo se partirá de la identificación de las lecciones aprendidas en materia de definición de algoritmos en el ámbito correspondiente y de las tendencias actuales en cuanto a explotación de información y aplicación de técnicas de big data y analytics para la determinación de patrones. Se hará una revisión sistematizada de los proyectos tanto públicos como privados de definición de modelos predictivos para identificar: variables de análisis empleadas, tipo de resultados previstos y modelos de análisis empleados. De este modo se determinará la representatividad e impacto a priori de las variables analizadas, se identificarán los posibles patrones de relación entre ellas e indicadores actuales, y se identificarán posibles palancas de creación de valor para los agentes de interés del sector, tanto públicos como privados.
- Definición de patrones y hábitos de comportamiento de los ciudadanos
El equipo de proyecto, compuesto por consultores, analistas, científicos del dato e investigadores, trabajará en la definición de casos de uso para cada uno de los sectores, atendiendo a problemas y retos identificados en el mercado, y definiendo como la analítica de los datos y la aplicación de inteligencia artificial podría ayudar a definir escenarios futuros que orientarían la toma de decisiones y permitirían obtener servicios que satisfagan las necesidades presentes y futuras de los ciudadanos, focalizando los esfuerzos de un modo más eficiente.
Definido el caso de uso, se establecerá una primera selección de variables de interés, atendiendo a los ámbitos de análisis objetivo del proyecto y a los resultados recogidos en el análisis del estado del arte. Se llevará a cabo un cribado de fuentes de información para valorar el alineamiento de las variables seleccionadas con la información realmente disponible. Así, se analizará tanto a nivel individual como desde el punto de vista de la homogeneidad del conjunto de variables, el nivel de calidad de los datos, la frecuencia con la que se publican los datos, si son datos puntuales o una secuencia de datos, la falta de información, período de información disponible, posible redundancia de las variables y relevancia de las mismas, etc.
Una vez determinado el conjunto de variables a estudiar, se identificarán los posibles patrones de relación entre las variables seleccionadas. En el caso de las variables no contrastadas pero seleccionadas por su posible potencial, se establecerán las hipótesis correspondientes de acuerdo con los expertos consultados.
- Definición de escenarios posibles a nivel de oferta de servicios con respecto a los patrones y hábitos previamente definidos
Se contrastarán las relaciones previstas con la situación actual elaborando tres escenarios asociados al área geográfica concreta, la definición de estos escenarios permitirá:
- Disponer de una primera valoración aproximativa de la validez de los patrones definidos, contrastando la información disponible a través de las variables de análisis con los resultados.
- Contrastar la oferta de servicios con la demanda prevista, valorando a su vez las diferencias entre los recursos esperados y los disponibles, e identificando otras posibles variables determinantes de la configuración de la oferta de servicios.
El análisis de los escenarios posibilitará plantear medidas de corrección de los patrones definidos, así como un eventual ajuste de las variables de análisis, así como del conjunto de indicadores de resultado seleccionados para valorar el estado de salud de las poblaciones.
- Definición de algoritmos prospectivos basados en los patrones previamente definidos
Una vez ajustada la selección de variables y la definición de los patrones, se formalizarán los algoritmos prospectivos. En particular:
- Se caracterizarán las variables, tanto desde el punto de vista matemático como de la alimentación de la información necesaria.
- Se definirán las funciones matemáticas que representen los patrones escogidos, incluyendo los ajustes sobre dichos patrones que se hayan planteado como resultado de la tarea.
- Se identificarán y describirán los indicadores de resultado y el comportamiento esperado de los mismos a partir de los escenarios definidos.
Se contrastarán dichos algoritmos con al menos otra técnica estadística de análisis y predicción de datos sobre los escenarios definidos, que permita estimar el rango de mejora del algoritmo y, en su caso, plantear ajustes que permitan mejorar su fiabilidad inicial.
Resultados esperados
El reto del presente proyecto consiste en analizar y encontrar soluciones diferenciales e innovadoras en la mejora de los servicios públicos y en la explotación y comercialización de los datos y de las infraestructuras públicas que potencien determinados territorios.
A partir de las actividades anteriormente mencionadas aparecen numerosas aplicaciones de uso público y de gran éxito, ampliamente adoptadas y las cuales logran cambiar el comportamiento de los usuarios. A continuación, se muestra una serie de aplicaciones inteligentes que serán relevantes para la futura comercialización de datos procedentes de infraestructuras de transporte.
- Definición de células urbanas con servicios mínimos.
- Optimización de las rutas de transporte.
- Optimización del uso y ubicación de los vehículos compartidos.
- Distribución inteligente para paquetes.
- Movilidad inteligente.
- Planificación de flujos de movilidad.
- Optimización de los recursos turísticos.
- Mantenimiento predictivo de infraestructura de transporte.
- Estacionamiento inteligente.
- Información multimodal integrada.
A nivel de salud además, el presente proyecto proporciona la posibilidad de crear productos y servicios comercializables, en ámbitos como la planificación óptima de recursos y oferta asistencial (p.ej. hospitales, centros de salud, etc.), nuevas estrategias de prevención en salud, Identificación de estrategias de tratamiento óptimas y desarrollo., desarrollo de nuevos modelos de diseño de infraestructuras, creación de nuevos productos turísticos saludables, identificación de mercados objetivo de atracción de demanda de turismo sanitario, evolución de personal devices/wearables/apps en materia de salud, tanto para la prevención como para la definición del tratamiento más adecuado, impulso de sistemas de movilidad saludables, eficientes y eficaces, etc.
Otros resultados importantes para las administraciones públicas será aquella información sobre la planificación de las infraestructuras, la dotación de infraestructuras necesaria para albergar el nuevo modelo de ciudad, el mantenimiento de las infraestructuras de transporte, la respuesta ante emergencias, la gestión semafórica o la operación y mantenimiento de la infraestructura ferroviaria y de metro.
Agradecimientos
El proyecto se desarrolla bajo la línea de ayudas de la Consejería de Educación e Investigación de la Comunidad de Madrid, para contribuir a la mejora de la cooperación público-privada en materia de I+D+i mediante el apoyo a proyectos de innovación tecnológica de efecto tractor elaborados por núcleos de innovación abierta en la Comunidad de Madrid, en el marco de la Estrategia Regional de Investigación e Innovación para una Especialización Inteligente (RIS3), dentro del programa operativo FEDER de la Comunidad de Madrid para el período 2014-2020.