Comunicación al V Congreso Ciudades Inteligentes
Autores
- Inmaculada Lucas Gómez, CEO, Izertis
- Javier Fernández Frade, Intern en Departamento de I+D+I, Aimsun
- Tomás García Fresno, Responsable de la Plataforma Informática de la Policia Local, Ayuntamiento de Santander
- Carmen Martino González, Técnico de Operaciones Banca Privada, Banco Santander
- David José Pérez Blanco, Ingeniero de Datos, Autónomo
Resumen
ML-Police es un Sistema de Predicción de accidentes de tráfico en áreas urbanas, que se lleva a cabo mediante el análisis, la consultoría y la integración de los datos con los que ya cuentan los Ayuntamientos y Cuerpos de Policía Local, relativos a los expedientes e informes técnicos emitidos como investigación de los accidentes acaecidos, pudiendo estar estos datos en diferentes repositorios. Dichos datos combinados con otros ofrecen una fuente inapreciable de conocimiento que, convenientemente transformada y explotada, dan un valor enorme extrayendo conocimiento que ayude a responsables de investigación de accidentes, y a responsables políticos en la toma de decisiones, tanto en el trazado de las estrategias de gestión de los recursos operativos, como la mejora de ordenación del tráfico urbano y el esclarecimiento de los hechos. Las Corporaciones Locales interesadas deberán poner a disposición sus fuentes de datos, las cuales serán analizadas, procesadas, filtradas e integradas en un portal web donde, mediante un acceso personalizado, podrá consultar las visualizaciones y trabajar con los cuadros de mando que faciliten la toma de decisiones y modelos de previsión que se preparen a medida para la problemática y necesidades concretas de su municipio. Se contempla el uso de Machine Learning, para predicción de puntos negros, fraudes, etc. Arquitectura Big Data para integrar clientes, datos más heterogéneos y voluminosos, como los de sensores (IoT), redes sociales, Open Data, etc.
Palabras clave
Predicción, Accidentes de Tráfico, Investigación de Accidentes, BigData, IoT
Introducción
Con el objetivo de alcanzar la máxima reducción de la siniestralidad en nuestras ciudades, la mejora de la seguridad vial urbana es una de las prioridades fundamentales de las actuales políticas de movilidad dentro de las áreas urbanas. Su consecución requiere de la implicación y colaboración de todos los agentes implicados. Los cuerpos de Policía Local en todo el territorio nacional tienen como misión y competencia la investigación de accidentes de tráfico en el casco urbano. Como consecuencia de ello, se asiste a las víctimas, se investigan los posibles delitos y/o faltas en que pudieran incurrir los implicados y se confeccionan los correspondientes informes técnicos que, en última instancia, tendrían como objetivo la aclaración de los hechos acaecidos determinando las causas que produjeron el siniestro y que pueden ser de utilidad en una potencial reclamación civil en sede judicial.
Uno de los hechos recurrentes que se repiten en muchos cuerpos de Policía Local, es que la labor policial en materia de accidentes de tráfico se reduce a la toma de los datos relativos a la mecánica del accidente para ser incorporados en los preceptivos informes técnicos y almacenados sistemáticamente. Desafortunadamente no son estudiados como fuente del conocimiento que puedan ayudar, tanto a los propios cuerpos policiales como a empresas aseguradoras, órganos judiciales e incluso responsables políticos de las entidades locales en la toma de decisiones y esclarecimiento de los hechos en torno a la siniestralidad, ya no como un hecho aislado sino como un hecho global a nivel municipal e incluso en relación con otras localidades circundantes. Es en este punto donde esta propuesta viene a llenar el hueco existente. Ante esta problemática se plantea como proyecto una plataforma de predicción de siniestralidad de accidentes de tráfico en las ciudades, integrando datos procedentes de diferentes fuentes policiales, ayuntamientos y Open Data. En el apartado de Prueba de Concepto, los datos nos arrojan conclusiones muy claras y fiables que en la mayoría de los casos no coinciden con las expectativas que se tienen. De ahí la relevancia en ofrecer una plataforma así a los mandos y políticos.
La aportación económica de un Servicio de Análisis y Predicción de Accidentes en áreas urbanas arroja beneficios relevantes para la sociedad al proporcionar a los dirigentes mayor fiabilidad en la toma de decisiones con el fin de mejorar y reducir la siniestralidad y permitir una gestión más eficiente de los recursos humanos y técnicos. A continuación, se enumeran algunos de los beneficios tanto cuantitativos como cualitativos respecto a la aportación de dicha propuesta:
- Cuantitativos:
- Reducción de la siniestralidad mediante la identificación y monitorización de puntos negros
- Optimización de los recursos operativos (diferentes cuerpos de policía, sanidad, etc)
- Gestión adecuada en el mantenimiento de vías y señalización. Se detecta donde es necesario intervenir
- Ahorro en la seguridad social/privada por atención a heridos
- Mejora sustancial en el tiempo de reacción de los Cuerpos de Policia frente a accidentes de tráfico
- Gestión más eficiente en la asignación de vehículos de emergencia
- Campañas de señalización específicas según patrones de conducta detectados
- Mejora en la estructuración de la ciudad
- Mejora en los procesos de trabajo de intervención de accidentes de tráfico de los Cuerpos de Policía Locales
- Cualitativos:
- Mejora de la seguridad vial para la ciudadanía
- Aumento de la sensación de seguridad y control
- Mejora en la calidad de vida de los agentes policiales
- Mayor y mejor formación ciudadana
- Tecnológicos:
- Integración con redes sociales, sensores (IoT), Open Data, etc.
En el mercado nacional existen en la actualidad varias plataformas destinadas a la gestión de Cuerpos Policiales. A continuación, se enumeran algunas de las más conocidas, aportando información sobre las mismas:
- Eurocop: Solución que cubre la gestión integral de la policía, tanto en el aspecto operacional (automatizando todas sus tareas operativas, administrativas, judiciales, etc., desde cualquier lugar y momento), como en el aspecto táctico y estratégico, a fin de lograr la máxima eficacia en la labor policial. Asimismo, cuenta con sistemas para la predicción y prevención del delito.
- Vinfopol: Se trata de una aplicación donde el policía puede automatizar al máximo su trabajo para disminuir el tiempo dedicado a realizar labores administrativas.
- Sistemapol: Aplicaciones modulares creadas con el objetivo de conformar un sistema operacional para la gestión de Cuerpos de Policía Local. Cuenta con un módulo destinado a la gestión de accidentes de tráfico (CPOL) que se integra con el módulo principal de Gestión (POL).
El proyecto
ML Police Sistema de predicción de accidentes de tráfico en casco urbano
Fase I
- Estudio de los datos de origen. Antes de abordar el análisis mediante técnicas de Machine Learning y visualización en cuadros de mando, es necesario un estudio en profundidad de los formatos que presenta el cliente objetivo y ver el grado de madurez tecnológica que tienen sus servicios de cara a la integración con la plataforma. Las fuentes de datos de las que se hará uso son las que se relacionan a continuación centrándonos en esta propuesta de un caso concreto de la ciudad de Santander para la prueba de concepto.
- Tráfico de la ciudad: Se toman los datos recogidos por los distintos dispositivos IoT desplegados en las vías que conforman el casco urbano de la ciudad de Santander. Dichos dispositivos monitorizan el tráfico que pasa por cada punto clave de la ciudad con una granularidad suficiente para establecer el flujo de vehículos por minuto.
- Informes técnicos elaborados por el Cuerpo de Policía Local de la ciudad: La información se halla generalmente estructurada en bases de datos relacionales donde se persisten los datos que son recogidos por los agentes en cada uno de los siniestros que se detectan en la ciudad.
- Datos meteorológicos: Provenientes de fuentes de acceso público en la web de la Agencia Estatal de Meteorologia (AEMET): https://opendata.aemet.es
- Creación de procesos ETL y almacenamiento en bases de datos. Una vez son analizados los datos es necesario crear los procesos de volcado en nuestras bases de datos con una estructura adecuada para su posterior análisis. Los procesos ETL deben quedar fijados para que de forma automatizada procedan al volcado periódico de los datos en nuestro sistema.
- Visualización mediante soluciones basadas en la nube (Carto, Tableau, QuickSight, etc). Los datos una vez limpiados y almacenados serán utilizados en el proceso de visualización mediante las herramientas adecuadas al efecto. Con ello se le proporcionará al cliente cuadros de mando adaptados a sus necesidades y que le mostrarán en tiempo real información sobre la siniestralidad en su municipio.
- Modelización ML basada en BigML. Se utilizarán los datos aportados por el cliente para hacer estudios basados en técnicas de Machine Learning que muestren previsiones sobre potenciales puntos negros, segmentación de diferentes tipologías de siniestros, franjas de edades y cualquier otra información proveniente de sus datos que resulte de interés para la toma de decisiones de los mandos policiales y autoridades del municipio cliente.
- Creación de un portal web que permita la operación con el sistema ML-Police. Con el fin de interaccionar con el sistema ML-Police, se crearía un portal web que, mediante acceso personalizado y seguro, permitiendo a cada cliente visualizar desde cualquier localización la información generada en los dos pasos previos.
- Securización y gestión de credenciales. Una pieza esencial de toda la arquitectura propuesta es la seguridad al objeto de proteger la información que se albergará en la plataforma. Si bien la plataforma es común a todos los clientes, el sistema quedará compartimentado para uno de ellos de forma que sus datos permanezcan separados y solo accesibles al personal autorizado.
- Posible integración de los modelos con los aplicativos del cliente. En algunos casos, clientes con un alto grado de madurez tecnológica pueden demandar la integración de sus sistemas con el sistema ML-Police. A tal efecto se crearía una API basada en servicios web (SOAP, REST) que permitiese la interacción de los sistemas cliente contra nuestro sistema de predicción y visualización.
Fase II
Escalabilidad del sistema incorporando las infraestructuras necesarias para la ingesta masiva de información desde múltiples clientes simultáneamente.
- Arquitectura basada en EMR (Elastic Map Reduce) de Amazon, plataforma de clúster administrado que simplifica la ejecución de los marcos de trabajo de Big Data, tales como Apache Hadoop y Apache Spark en AWS para procesar y analizar grandes cantidades de datos. Mediante el uso de estos marcos de trabajo y proyectos de código abierto relacionados, como Apache Hive y Apache Pig, puede procesar datos para los fines de análisis y cargas de trabajo de inteligencia empresarial. Además, puede utilizar Amazon EMR para transformar y trasladar grandes cantidades de datos hacia y desde otros almacenes de datos y bases de datos de AWS, tales como Amazon Simple Storage Service (Amazon S3) y Amazon DynamoDB.
- Integración en bases de datos NoSQL. Si bien en una fase inicial se partirá de fuentes de datos estructuradas que contengan información relativa a los accidentes de tráfico, es previsible que algunos clientes proporcionen fuentes provenientes de diferentes orígenes como pueden ser sensores IoT, sistemas de mensajería, redes sociales, etc. La naturaleza de esta información haría aconsejable incorporar bases de datos de tipo NoSQL (MongoDb, Cassandra, AWS DynamoDB) que ayudarían a un mejor procesamiento de este tipo de información.
Descripción de los componentes
En todos los pasos expuestos se opta por la incorporación de componentes fundamentalmente basados en la nube. Esto reduce los costes de implantación y mantenimiento de forma sustancial. Se incluye una estimación de costes basándose básicamente en los servicios proporcionados por Amazon AWS.
- Almacenamiento en BBDD – Amazon RDS. Amazon RDS está disponible para varios tipos de instancias de base de datos (optimizadas para memoria, rendimiento u operaciones de E/S) y proporciona seis motores de bases de datos conocidos entre los que elegir, incluidos Amazon Aurora, PostgreSQL, MySQL, MariaDB, Oracle Database y SQL Server. Se puede usar AWS Database Migration Service para migrar o replicar las bases de datos existentes en Amazon RDS con relativa facilidad.
- Repositorio Big Data – EMR. Amazon EMR como plataforma de clúster administrado que simplifica la ejecución de los marcos de trabajo de Big Data, tales como Apache Hadoop y Apache Spark en AWS para procesar y analizar grandes cantidades de datos. Si el proyecto crece hasta el punto de hacerse necesario un procesamiento vía Hadoop se podría incorporar Elastic Map Reduce como elemento de almacenamiento.
- Procesos ETL – AWS Glue. AWS Glue es un servicio plenamente administrado de ETL (extracción, transformación y carga) que proporciona una forma rentable y sencilla de categorizar los datos, limpiarlos, enriquecerlos y moverlos de manera fiable entre distintos almacenes de datos. No usa servidor, por lo que no hay ninguna infraestructura que configurar ni administrar. El software de ETL de Amazon AWS factura por horas según la duracion de los procesos ejecutados.
- Visualización – AWS QuickSight. Amazon QuickSight es un servicio de análisis empresarial que se utiliza para crear visualizaciones, realizar análisis ad hoc y obtener información útil empresarial a partir de los datos.
- Deep Learning – AWS SageMaker. Amazon SageMaker es un servicio de aprendizaje automático completamente administrado que permite a los desarrolladores y a los analistas de datos crear y perfeccionar modelos de aprendizaje automático de forma rápida y sencilla, y a implementarlos directamente un entorno alojado listo para su uso. La capacitación y el alojamiento se cobran por minutos de uso, sin tarifas mínimas y sin compromisos iniciales. Una vez procesados los datos se costeará solo el tiempo de entrenamiento de los modelos.
- Seguridad – AWS Certificate Manager. Permite aprovisionar, administrar e implementar con facilidad certificados de capa de conexión segura/seguridad de la capa de transporte (SSL/TLS) públicos y privados para su uso con servicios de AWS y recursos internos conectados. Se usan para proteger comunicaciones por red y para definir la identidad de sitios web mediante Internet y recursos en redes privadas. Solo se ha de pagar por los recursos de AWS que creen para ejecutar la plataforma.
Estimación de Costes
Estimación de los costes mensuales que pudieran derivarse por el mantenimiento de una infraestructura para dar servicio a un Municipio de tipo medio como pudiera ser la ciudad de Santander.
Resultados y datos obtenidos – prueba de concepto
Análisis de la turbo glorieta de Valdecilla Sur
Exponemos un caso que levantó especial debate en la ciudad de Santander y que precisamente mediante un análisis basado en los datos de que se dispone se puede dar más luz al respecto. El 4 de enero de 2019 se publicaba en prensa que los conductores del TUS (Transporte Urbano de Santander) solicitaban el desmantelamiento de la turbo glorieta de Valdecilla Sur por considerar que produce importantes retenciones hablando incluso de caos circulatorio, a pesar de reconocer que la turbo glorieta de la S20 sí ha solventado el problema de volumen de tráfico y ha disminuido el número de accidentes. Para poder dar resultados objetivos, se han utilizado los sensores intensidad de tráfico con los que se ha instrumentado la infraestructura municipal, Figura 1.
Analizando el tráfico en la hora punta, también se observa un uso más reducido de la infraestructura. Si tenemos en cuenta la siniestralidad, sí que se percibe una reducción del número de siniestros.
Localización de puntos negros
Esto permite identificar puntos geográficos que, únicamente a partir del número de siniestros, quedan ocultos.
Discusión y conclusiones
El cambio de coordenadas de la base de datos de la Policía Local de Santander ha resultado más complejo de lo que se esperaba. Ha habido que promediar varios puntos para poder realizar el cambio de la forma más fiel a la realidad posible. Así mismo, el volcado de datos de tráfico tampoco ha resultado trivial: era tal la cantidad de datos que era imprescindible optimizar las consultas para obtener medidas de forma ágil, de hecho, se optó por una versión promediada del tráfico para que la base datos pudiera ser alojada en AWS y que los cálculos se realizan de forma ágil. Esto pone de manifiesto que la gran cantidad de datos que se pueden llegar a generar en estas situaciones haga necesaria la incorporación de arquitecturas de BigData. Los gráficos obtenidos a partir de los datos almacenados pueden ayudar a las autoridades municipales y mandos policiales a una mejor toma de decisiones. La detección de las franjas de edad que se han estudiado puede ayudar a la hora de focalizar campañas de sensibilización entre las poblaciones que están resultando más vulnerables. Se podrían realizar charlas en colegios e institutos de las zonas donde más se han producido estos accidentes para intentar reducir la siniestralidad en cuestión de atropellos. De igual modo, se pueden dirigir campañas entre los conductores de la ciudad para evidenciar el problema e intentar reducir los despistes y pérdidas de atención a la señalización que hayan motivado los atropellos. Estas medidas, no solo ayudarán a su reducción, sino que también afectaría al descenso de siniestralidad en otras tipologías. Posteriormente, la retroalimentación del sistema con nuevos datos permitirá evaluar si las medidas adoptadas están dando sus frutos o, si por el contrario, se han elegido estrategias erróneas. Aunque los datos utilizados sean relativos a la ciudad de Santander, el modelo sería perfectamente exportable a cualquier otra ciudad dentro del territorio nacional. De hecho, compartiendo la información de diferentes municipios, se podrían hallar nuevos patrones de conducta que podrían dirigir las campañas de sensibilización a nivel nacional o local, según el caso.
Reconocimientos / Agradecimientos
Nuestro reconocimiento a: EOI (Escuela de Organización Industrial) especialmente a D. Alberto Isiwaka, a D. Alberto Turégano y a D. Jaime del Pozo que han colaborado a mejorar el estudio.
Y nuestro agradecimiento también al Ayuntamiento de Santander, Policía local y Tráfico que han dado acceso a materiales y datos para realizar la prueba de concepto expuesta.