Comunicación presentada al V Congreso Ciudades Inteligentes
Autores
- María José Sala, Consultora de Transporte y Movilidad, Nommon Solutions and Technologies
- Miguel Picornell, Director, Kineo Mobility Analytics, Nommon Solutions and Technologies
- Oliva García-Cantú Ros, Directora I+D+I, Nommon Solutions and Technologies
Resumen
La planificación y gestión sostenible de las ciudades requiere información precisa y actualizada sobre el comportamiento ciudadano. Los métodos tradicionales, como las encuestas, aportan información detallada, pero son procesos lentos y costosos, limitando la muestra y la frecuencia de actualización. El uso de dispositivos móviles permite recoger datos geolocalizados con alta resolución espacio-temporal con una muestra muy superior, proporcionando información sobre flujos de movilidad y presencia de la población. Esta comunicación se centra en el análisis de registros anonimizados de telefonía móvil y su fusión con datos procedentes de otras fuentes para proporcionar dicha información en ámbitos de aplicación como el transporte, el medio ambiente y el turismo.
Palabras clave
Datos Geolocalizados, Movilidad, Presencia de la Población, Telefonía Móvil, Fusión de Datos, Análisis Espacio-temporal, Transporte, Medio Ambiente, Turismo
Introducción
La creciente concentración de la población mundial en las ciudades conlleva nuevos retos en el desarrollo y la gestión sostenible de las mismas. En ciudades que crecen, las distancias y los desplazamientos de los habitantes aumentan, por lo que la correcta planificación y operación del sistema de transporte es fundamental y llevarla a cabo requiere información precisa, fiable y actualizada de la demanda de movilidad. El aumento de las emisiones procedentes de la industria y del uso de combustibles convierte a la contaminación del aire en un problema creciente en las urbes. La definición de estrategias efectivas que mitiguen la exposición de la población a la contaminación se ha de servir de información sobre la distribución espacio-temporal de la población a lo largo del día. Asimismo, el crecimiento de las ciudades crea nuevos centros de actividad y servicios que atraen tanto a residentes como a no residentes en las mismas y el diseño de una oferta turística sostenible que concilie la gestión de los espacios y servicios públicos necesita conocer los patrones de actividad de unos y otros en la ciudad. El ámbito del transporte, el medio ambiente y el turismo son sólo algunos ejemplos en los que disponer de información acerca de la movilidad y la presencia de la población es esencial para la estrategia y gestión de la ciudad.
Tradicionalmente, la información sobre el comportamiento ciudadano y del turista se ha obtenido fundamentalmente a partir de encuestas, que proporcionan información muy completa, detallada y valiosa, pero que no están exentas de limitaciones. La realización de encuestas es costosa en términos económicos y de tiempo, lo que suele conllevar a que los tamaños de las muestras sean reducidos y a que la información se encuentre, en muchos casos, desactualizada. Además, la dependencia de la disponibilidad a contestar del entrevistado y las imprecisiones de las respuestas pueden producir muestras sesgadas; por ejemplo, capturando sólo usuarios con mayor disponibilidad de tiempo. También se puede obtener información incompleta, ya que a menudo los entrevistados olvidan reportar algunas actividades, estiman los tiempos de viaje de manera aproximada, etc.
En los últimos años, la proliferación de dispositivos móviles personales ha abierto nuevas oportunidades para recoger datos geolocalizados sobre la actividad y la movilidad de la población, de manera dinámica y a un coste sensiblemente inferior al de los métodos tradicionales. Los datos procedentes de las redes de telefonía móvil, generados originalmente a efectos de facturación o de gestión de la red, resultan particularmente interesantes para este propósito, gracias a la posibilidad de obtener muestras de gran tamaño de prácticamente todos los segmentos de población y con una elevada resolución espacio‑temporal en general adecuada para estudios a escala urbana y metropolitana [2], [5]. Sin embargo, no siempre es posible extraer toda la información necesaria a partir de datos de telefonía móvil y habitualmente es necesario fusionarlos con datos procedentes de diferentes fuentes. En la siguiente sección se describe una solución para el análisis de registros anonimizados de telefonía móvil y su fusión con otros datos para proporcionar información sobre la actividad y la movilidad de la población que ya ha sido empleada en un amplio número de proyectos. En esta comunicación se presentan tres casos de aplicación, correspondientes al ámbito del transporte, del medio ambiente y del turismo:
- estudio de la movilidad general y la movilidad en transporte público en Málaga
- estudio de la exposición a la contaminación en Madrid
- análisis de los visitantes al Parque Nacional de la Sierra de Guadarrama
Descripción de la solución
La solución basada en los algoritmos de Nommon analiza registros de telefonía móvil y los integra con datos de la red de transporte, usos del suelo y datos sociodemográficos para proporcionar información sobre la actividad y la movilidad de la población. La Figura 1 muestra un esquema de alto nivel de la solución.
A continuación, se describen brevemente los datos de entrada, las principales etapas de procesado y análisis de los datos, y la información resultante de dicho proceso.
Datos y metodología
En esta sección se presentan los datos empleados en el estudio de los tres casos de uso introducidos, la metodología general para la obtención de información de movilidad y actividad de la población a partir del análisis de registros anonimizados de telefonía móvil y la metodología particular empleada en los casos particulares de aplicación que se describen más adelante.
Datos
Las primeras fuentes de datos que se presentan a continuación son comunes a todos los casos de aplicación, mientras que posteriormente se presentan otras fuentes de datos que son específicas para cada caso.
- Datos de telefonía móvil. Los datos incluyen los registros generados cada vez que se produce un evento de interacción de un terminal móvil con la red. Este puede ser de manera activa, por ejemplo, al efectuar o recibir una llamada, enviar un mensaje de texto o conectarse a Internet, o de manera pasiva, por ejemplo, al cambiar de área de cobertura o actualizarse la red. Cada registro contiene, entre otros, un identificador anonimizado del usuario, la hora a la que tiene lugar el evento, la antena a la que el dispositivo se conecta en el momento del evento y el tipo de evento (llamada, SMS, datos). Los datos de telefonía proporcionan una granularidad temporal elevada, lo que permite determinar con alto nivel de detalle la localización del dispositivo a lo largo del día. En cuanto a la granularidad espacial, se dispone de información de localización de los dispositivos a nivel de antena, cuya granularidad espacial varía desde entre unas decenas o cientos de metros en entornos urbanos hasta varios kilómetros en zonas rurales con menor densidad de población.
- Datos del Padrón Municipal de Habitantes. Los datos del número de habitantes a nivel de sección censal se emplean como marco muestral de los usuarios residentes en España para expandir la muestra obtenida con los datos de telefonía al total de la población de estudio.
- Movimientos Turísticos en Frontera. Las estadísticas de movimientos turísticos en frontera se emplean como marco muestral de los visitantes no residentes en España para expandir la muestra obtenida mediante los datos de telefonía móvil al total de la población visitante durante el periodo de estudio.
- Datos de usos del suelo. Para aumentar la precisión de la localización de las actividades, se emplean mapas de usos del suelo provenientes del Sistema de Información Sobre Ocupación del Suelo Español.
Además de los datos arriba mencionados, para el estudio de la movilidad general y en transporte público en Málaga se emplearon los siguientes datos adicionales:
5. Datos de tarjeta inteligente de transporte. Los datos de la tarjeta inteligente de transporte público incluyen el identificador anonimizado de la tarjeta e información sobre la hora, la localización y el tipo de validación. En cuanto a la localización de una validación, esta puede corresponder a la localización de una estación o a la posición del vehículo en la que se produjo dicha validación, obteniéndose la misma a través del Sistema de Ayuda a la Explotación (SAE), que contiene información GPS de cada vehículo. Respecto al tipo de validación, esta puede ser de entrada o de salida.
6. Otras fuentes de datos sobre la red de transporte público. Otros datos no asociados a la tarjeta de transporte público, pero interesante para los estudios de la movilidad, incluyen:
- datos procedentes de la red y de la oferta de servicios, como paradas, líneas, etc.
- datos del SAE
- valores totales de demanda, incluyendo tanto a los usuarios de la tarjeta de transporte como a los viajeros que emplean otros títulos de transporte
Para el caso del estudio de la exposición a la contaminación en Madrid se emplearon los siguientes datos adicionales:
7.Datos de contaminantes del aire en Madrid. La información de concentración de NOx medida en las distintas estaciones del Ayuntamiento de Madrid se empleó para obtener los niveles de contaminantes en cada zona de la ciudad.
Finalmente, para el análisis de los visitantes al Parque Nacional de la Sierra de Guadarrama se emplearon los siguientes datos adicionales:
8.Conteos de visitantes al Parque Nacional de la Sierra de Guadarrama. Estos datos incluyen datos de aforos de vehículos en los aparcamientos del parque, contadores de pisada y encuestas presenciales en los centros de visitantes del parque.
Metodología
La obtención de información sobre la movilidad y la actividad de la población a partir del análisis de registros anonimizados de telefonía móvil comprende los siguientes subprocesos:
- Selección de la muestra. Se seleccionan aquellos usuarios que presenten una frecuencia de registros suficiente para obtener patrones de movilidad y actividad con fiabilidad.
- Identificación de lugar de residencia y otros lugares frecuentados para los residentes en España. Para cada usuario válido se utilizan datos históricos para construir un perfil de actividad. Este perfil recoge las horas de mayor y menor actividad, así como las zonas más visitadas y el tiempo promedio de estancia en cada una de ellas. A partir del perfil de actividad, y cruzando las localizaciones con los mapas de uso de suelo se obtienen el lugar de residencia, el lugar de trabajo y otros lugares frecuentados por el usuario.
- Identificación de características de los extranjeros. A partir de un estudio longitudinal de la actividad de los usuarios extranjeros se identifica el país de residencia de los mismos y sus características como visitantes: si se trata de turistas o excursionistas, sus tiempos de estancia, etc.
- Estimación de movilidad y actividad. Para el o los días de estudio, se reconstruyen las posiciones de las actividades y los viajes realizados por cada uno de los usuarios incluidos en la muestra de cada día. Se entiende como “actividad” una interacción o conjunto de interacciones con el entorno que tienen lugar en una misma localización y que motivan que el individuo se desplace hasta allí y como “viaje” el desplazamiento entre las localizaciones de dos actividades consecutivas. La información obtenida del perfil de actividades del usuario se combina con distintos criterios de tiempos de estancia para identificar actividades y viajes a partir de los registros del día de estudio.
- Elevación de la muestra al total de la población. Utilizando información sociodemográfica, la información de viajes y actividades se expande al total de la población. Para el caso de los residentes en España, se emplean factores de elevación basados en el hogar a nivel de sección censal, mientras que en el caso de los visitantes extranjeros se emplean factores de elevación basados en datos de movimientos turísticos en frontera.
Esta metodología general se aplicó a los tres casos de uso mencionados, para los que se detalla a continuación cómo se emplearon los registros de telefonía móvil y con qué otros datos se fusionaron.
Casos de aplicación
Movilidad en la ciudad de Málaga
En el primer caso de aplicación, se estudió la movilidad general en la ciudad de Málaga a partir de registros de telefonía móvil y la movilidad en transporte público a partir de datos de la tarjeta inteligente de transporte y de telefonía móvil.
- Movilidad general: En primer lugar, se identificó el lugar de residencia de los usuarios potenciales de la muestra y se filtraron los residentes en Málaga. Para estos, se obtuvieron los viajes a nivel muestral para un día laborable promedio y se elevó esta información al total de la población de la ciudad.
- Movilidad en transporte público [1], [3], [4], [6]: La información de la parada de subida se obtuvo directamente de los datos de la tarjeta inteligente de transportes, que presentan esta información de forma explícita o presentan la información del coche en el que se valida a la subida. En estos casos, a partir del SAE se puede obtener la información de la parada. Para la estimación de las paradas de bajada se utilizó información longitudinal de varios días. Por ejemplo, la posición de la parada de subida en un tiempo subsecuente se usaba para estimar la posición de bajada del viaje anterior. Se emplearon criterios de tiempos de espera y de estancia para distinguir entre bajada en parada de destino y bajada en parada de transbordo. La muestra de viajes en transporte público a nivel de parada se expandió empleando la información de viajes totales.
Para la estimación de los orígenes y los destinos reales de los viajes se reconstruyeron las áreas de atracción de cada parada a partir de los datos de telefonía móvil y criterios de accesibilidad. Finalmente, el origen y destino final de los usuarios en cada parada fue asignado a las distintas zonas pertenecientes al área de atracción en función del potencial de atracción de cada zona, estimado a partir de la información de usos de suelo.
Exposición a la contaminación en la ciudad de Madrid
En este caso se estudió la exposición real de los habitantes de la ciudad de Madrid a las emisiones de NOx mediante una estimación dinámica de la exposición a contaminantes considerando la posición real de la población a distintas horas del día y no solamente sus lugares de residencia como realizan las aproximaciones tradicionales.
Los niveles de NOx en las distintas zonas de la ciudad fueron estimados con un modelo de dispersión de partículas desarrollado por el Departamento de Ingeniería Química y Medioambiental de la Universidad Politécnica de Madrid con datos obtenidos de las estaciones de medición de contaminantes del ayuntamiento de Madrid. La presencia de personas en las distintas zonas de la ciudad a diferentes horas del día se obtuvo a partir de los datos de telefonía móvil, según la metodología descrita.
Análisis de los visitantes al Parque Nacional de la Sierra de Guadarrama
En este caso de uso, se estudiaron los flujos de visitantes al parque usando datos de telefonía móvil. Empleando la metodología descrita, se obtuvo la procedencia de los visitantes, así como la presencia de estos en el parque y la duración de su estancia. Los datos de encuestas, aforos y conteos de pisadas, utilizados hasta el momento para estimar los volúmenes de visitantes y obtener información acerca de las rutas seguidas dentro de él, se utilizaron para corregir la muestra en los casos en que la granularidad espacial de los datos de telefonía móvil no permitía distinguir correctamente entre usuarios ubicados dentro y fuera del parque.
Resultados
En los tres casos de aplicación expuestos los datos procedentes de la red de telefonía móvil, así como su fusión con datos procedentes de otras fuentes, jugaron un papel esencial en la obtención de información relevante para el problema a abordar.
En el caso del estudio de la movilidad en Málaga, la información de viajes obtenida se agregó en matrices origen-destino de acuerdo con una zonificación definida, obteniendo así matrices origen-destino de movilidad general y de transporte público, permitiendo obtener una información de gran calidad sobre la distribución de viajes y el uso del transporte público en la ciudad.En cuanto al caso del estudio de la exposición de contaminantes en la ciudad de Madrid, con la información resultante se obtuvo un índice de exposición, definido como número de personas por hora multiplicado por la concentración de contaminantes. Por primera vez se pudo analizar cuál es la exposición de la población según su secuencia de actividades a las distintas horas del día en distintas zonas de la ciudad. Los resultados permitieron observar que las curvas del indicador resultante difieren notablemente del enfoque estático (que utiliza sólo datos del censo) para la mayor parte de las horas del día.
Por último, en el caso del estudio sobre los visitantes al Parque de Guadarrama, los datos de la telefonía móvil permitieron tener una información completa sobre el número de visitantes, el perfil (procedencia, edad y género) de los mismos y su tiempo de estancia en el parque, así como la recurrencia de las visitas, información que resulta complicado obtener de forma fiable a partir de las fuentes tradicionales.
Conclusiones
Hasta ahora, el desarrollo y la operación de las ciudades se ha basado en información obtenida mediante metodologías tradicionales, con muestras reducidas de la población y a menudo información desactualizada. Los tres ejemplos de casos de aplicación presentados ponen de manifiesto el potencial que tiene la explotación de las grandes bases de datos procedentes de dispositivos móviles, en particular los datos procedentes de las redes de telefonía móvil, para la planificación y diseño de políticas de desarrollo urbano sostenible. Los casos presentados muestran que los datos de telefonía proporcionan una información muy rica; sin embargo, por sí solos no siempre son suficientes para obtener una imagen completa de la movilidad y la presencia de la población. Por ello, es necesario incorporar en los estudios datos procedentes de diferentes fuentes relevantes para el problema a analizar y desarrollar metodologías y algoritmos de fusión de datos. La combinación de diferentes datos permite aprovechar las fortalezas de algunos y compensar las debilidades de otros. La utilización de datos de telefonía móvil para el análisis de la presencia y movilidad de la población es ya una realidad que abre interesantes oportunidades para la planificación y la gestión de ciudades inteligentes, desde evaluar la exposición a la contaminación de sus ciudadanos a analizar cómo están influyendo nuevos conceptos de movilidad urbana (movilidad compartida o movilidad como servicio) en la ciudad o cómo está impactando el turismo en la economía y el desarrollo urbano.
Referencias
- Alsger, Azalden A., et al., 2018, Use of smartcard Fare Data to Estimate Public Transport Origin–Destination Matrix, Transportation Research Record: Journal of the Transportation Research Board 2535.
- S. Çolak, L.P. Alexander, B.G. Alvim, S. R. Mehndiratta & M.C. González, 2015, Analyzing Cell Phone Location Data for Urban Travel: Current Methods, Limitations, and Opportunities, Transportation Research Record: Journal of the Transportation Research Board 2526.
- Cui, A., 2006, Bus Passenger Origin-Destination Matrix Estimation Using Automated Data Collection Systems (Doctoral dissertation, Massachusetts Institute of Technology).
- Munizaga, M. A., & Palma, C., 2012, Estimation of a Disaggregate Multimodal Public Transport Origin–Destination Matrix from Passive Smartcard Data from Santiago, Chile, Transportation Research Part C: Emerging Technologies.
- Picornell, M., Ruiz, T., Lenormand, M., Ramasco, J.J., Dubernet, T. & Frías-Martínez, E., Exploring the Potential of Phone Call Data to Characterize the Relationship between Social Network and Travel Behavior.
- Trépanier, M., Tranchant, N., & Chapleau, R., 2007, Individual Trip Destination Estimation in a Transit Smartcard Automated Fare Collection System, Journal of Intelligent Transportation Systems.