Comunicación presentada al VI Congreso Ciudades Inteligentes
Autores
- José María Boyano Sánchez, Subdirector Gral. de Innovación e Información Urbana, Ayuntamiento de Madrid
- Jesús Cerezo Arillo, Jefe de Servicio de Integración de Procesos, Ayuntamiento de Madrid
- Natalia Rodríguez Núñez-Milara, CEO, Saturno Labs
Resumen
La Subdirección General de Innovación e Información Urbana del Ayuntamiento de Madrid mantiene el Visualizador Urbanístico para el acceso telemático al Planeamiento y la Gestión Urbanística. Sus datos se cargan mediante un aplicativo propio desarrollado sobre infraestructura ArcGIS, la Plataforma Puerta de Alcalá. La integración de esta plataforma con el tramitador de expedientes y con el archivo electrónico garantiza la integridad y veracidad de la información difundida en Internet. La búsqueda de información mediante voz está sufriendo un crecimiento exponencial. Se entiende que su uso mejorará de manera significativa la experiencia de la comunicación entre la ciudadanía y la administración. A tal efecto se ha realizado una prueba de concepto para evaluar la aplicabilidad de técnicas de inteligencia artificial como la del procesamiento del lenguaje natural y la de machine learning para facilitar, a través de altavoces inteligentes y chatbots, el acceso a la información urbanística que publica el Ayuntamiento de Madrid.
Palabras clave
Información Urbanística, Inteligencia Artificial, Procesamiento Lenguaje Natural, Voz, Asistente Virtual, Transformación Digital
Introducción
La Constitución de 1978 consagra en su título preliminar los principios de legalidad, jerarquía normativa y publicidad de las disposiciones normativas. Así mismo establece el urbanismo como competencia propia de las comunidades autónomas, a la par que garantiza la autonomía de los municipios.
De esta manera el planeamiento urbanístico se configura de una manera dual, siendo elaborado en la esfera municipal, pero sometido a la tutela de las comunidades autónomas. El planeamiento urbanístico tiene un carácter normativo, lo que obliga por tanto a su publicidad, y así se ha venido haciendo tradicionalmente.
Con el paulatino uso corporativo de los sistemas de información geográfica desde finales del siglo pasado, se ha logrado contar desde hace más de diez años con visores desplegados en Internet que permiten cumplir con la publicidad del planeamiento urbanístico de forma telemática.
En este sentido el Ayuntamiento de Madrid gestiona de forma interna la información de todo el planeamiento urbanístico que es de aplicación en el término municipal mediante la Plataforma Puerta de Alcalá, un aplicativo propio desarrollado sobre infraestructura ArcGIS. La integración de esta plataforma con el tramitador de expedientes y con el archivo electrónico garantiza la integridad y veracidad de la información que es difundida en Internet a través del Visor Urbanístico.
No obstante, los visores de este tipo plantean una complejidad de uso desde dos puntos de vista:
- por una parte estamos hablando de una información muy especializada, que generalmente requiere que la ciudadanía cuente con el asesoramiento de un profesional
- y por otra, incluso para aquellos que gozan de las habilidades tecnológicas suficientes y del conocimiento especializado necesario, el acceso a la información requiere un tiempo elevado de interacción con el ordenador, tableta o móvil.
Cualquier búsqueda parte del acceso a la aplicación para, bien navegando visualmente, bien a través del callejero, localizar el punto de interés. Una vez ubicado es posible obtener la información en sí, eligiendo entre los diferentes servicios de mapas que la contienen, cada uno de ellos con su leyenda y su formulario específico. El número de interacciones con la aplicación es alto y el tiempo, excesivo para los estándares que estamos acostumbrados a manejar hoy en día, con la potencia de los teléfonos que llevamos en nuestros bolsillos.
Y es que, precisamente a raíz de la alta penetración de los teléfonos inteligentes, los hábitos de la ciudadanía están cambiando y se ha producido un crecimiento exponencial del uso de servicios deslocalizados, lo que a su vez ha derivado en la búsqueda de la inmediatez en el acceso a la información. El sentimiento de frustración que genera la demora en el acceso o su inaccesibilidad marca negativamente la reputación de las administraciones.
En este contexto el Ayuntamiento de Madrid ha elaborado un estudio para analizar la viabilidad de alternativas que faciliten esta tarea a la ciudadanía, y conseguir mejorar de forma drástica los tiempos de obtención de la información.
El prototipo Cibeles
Nace así el prototipo Cibeles, que busca un alineamiento tecnológico con la ciudadanía y la ruptura de la brecha digital existente en parte de la misma. Conseguir estos objetivos supondrá un acercamiento a la sociedad, que redundará en un sentimiento de afección hacia la administración, que la ciudadanía comenzará a percibir como algo propio, que le pertenece.
La inteligencia artificial
Lo que desde otros ámbitos —el cine o la literatura— se nos ha presentado como inteligencia artificial, hace que no seamos conscientes de que esta tecnología está presente desde hace años en nuestros quehaceres habituales. Baste como ejemplo el empleo masivo que de ella hacen los teléfonos móviles actuales, en un gesto tan habitual como tomar una fotografía: un sistema entrenado detecta el rostro de todas las personas presentes en el objetivo y nos dibuja un cuadrado amarillo sobre cada uno de ellos.
La inteligencia artificial tiene muchos campos de actuación. Entre ellos, y a nuestros efectos, hay que destacar el hecho de que ha posibilitado el desarrollo de técnicas de Procesamiento del Lenguaje Natural. Esta tecnología también está presente en nuestros teléfonos móviles desde hace casi diez años a través de asistentes virtuales como Siri, Alexa o Cortana, entre otros.
La voz como herramienta para interactuar
Estudios recientes recogen que el 96% de la ciudadanía española tiene al menos un teléfono móvil, y de ellos un 87% son teléfonos inteligentes. El estudio sobre hábitos de uso pone de manifiesto que la navegación por Internet cada vez se hace de forma más habitual a través de dispositivos móviles, en detrimento del ordenador. Esta preferencia es todavía mayor cuando nos referimos a la búsqueda de información o al consumo de redes sociales. No es de extrañar, pues, que Google tenga previsto cambiar su algoritmo de posicionamiento en septiembre de este mismo año y únicamente vaya a tener en consideración el tráfico móvil de un sitio web.
Aunque las citadas tecnologías de procesamiento del lenguaje natural y de machine learning están cada vez más presentes en los teléfonos, sólo el 30% de usuarios las conoce y únicamente un 15% las utiliza, la mayoría de las veces para buscar información y realizar llamadas. No obstante, se está comprobando un crecimiento exponencial en las búsquedas por voz que hace presumir que para el final de 2020 se sitúen entorno a un 50%.
El empleo del lenguaje natural
El uso de la voz se traduce en una mejora significativa de la experiencia de búsqueda de información, dado que el procesamiento del lenguaje natural considera la pregunta completa y no sólo las palabras clave. Esta búsqueda semántica proporciona los resultados que se están buscando, eliminando los ineficaces.
Por encima de este mayor acierto conseguido en los resultados, el principal beneficio en las interacciones de la ciudadanía con la administración se debe precisamente al canal de la comunicación, ya que al tratarse del lenguaje natural resulta más fácilmente comprensible que cualquier otro interfaz informático. Si a esto, con lo que ya contábamos en la atención presencial, le añadimos que el servicio se puede prestar veinticuatro horas al día, siete días a la semana, los trescientos sesenta y cinco días del año, y que es accesible desde cualquier punto del mundo en el que se tenga cobertura de datos, concluiremos que estamos ante la posibilidad de prestar unos servicios de información urbanística como nunca antes habíamos soñado.
La solución
Unificar servicios
Lo primero que ha hecho el Ayuntamiento es generar un servicio web de planeamiento que devuelve toda la información disponible necesaria. De esta manera, invocando el servicio mediante una única petición, se obtienen para una posición geográfica determinada todos los parámetros urbanísticos que figuran almacenados en las bases de datos corporativas, accesibles como se menciona más arriba a través de los distintos servicios de mapas. Evidentemente esto ha sido posible gracias a que toda la información necesaria estaba previamente modelizada y correctamente almacenada.
Detectar qué quiere la persona
Qué
Contando con este servicio web en funcionamiento, la pregunta esencial que planteó el estudio era saber si una máquina era capaz de inferir la intención de la pregunta, esto es, saber cuál era la información requerida y para qué posición dentro del término municipal se estaba demandando.
Para detectar las posibles intenciones dentro de la pregunta se creó una clasificación de la información que podía ser solicitada. A partir de ahí, y mediante el empleo de DialogFlow, se entrenó al sistema para lograr un porcentaje mayor de acierto y corregir las desviaciones que surgieron. Con esto se obtuvo un slot de posibles intenciones.
Dónde
La fase siguiente consistió en detectar la posición para la cual se demandaba información dentro de la pregunta formulada. Para resolver esta cuestión se adoptó como punto de partida, como opción más plausible, que el usuario se refiriera a ella por una dirección determinada, esto es, una calle y un número de policía.
El Ayuntamiento contaba ya con un servicio web de Callejero, al que se invoca con el nombre de una calle y un número y que devuelve el identificador único del número de policía oficial correspondiente. Este identificador único permite realizar una llamada al servicio web de planeamiento antes mencionado con lo que se accede al conjunto de información susceptible de ser demandada.
Interacción
Una vez se ha recuperado toda la información se almacena en memoria y comienza la interacción con el usuario. Se ha tomado la decisión de fragmentar la información con el fin de conseguir interacciones más cortas, ofreciendo siempre la posibilidad de, bien acceder al resto de información disponible, bien recibir toda la información mediante un correo electrónico, que contiene además enlaces a la documentación relativa de cada expediente administrativo que afecta a la posición que es objeto de consulta.
Toda la interacción con los servicios web municipales se ha resuelto con funciones lambda serverless de Amazon Web Services. El uso de esta solución tecnológica combinada entre DialogFlow y funciones lambda de AWS ha permitido exportar la solución a Twitter generando un chatbot. De esta manera se pueden enviar mensajes directos o menciones a la cuenta @InforUrbanMadrid y así iniciar un diálogo con los mismos criterios que se usan para la interacción por voz: una única petición a los servicios web y entrega de la información con interacciones cortas.
Gestión emocional
Para el prototipo se han implementado reglas en el sistema para gestionar el lado emocional de la interacción, por ejemplo, con mensajes del tipo “El lunes pasado te di información urbanística sobre Plaza de la Villa 5, ¿te fue útil la información?”, o interactuando con el usuario usando su nombre de pila.
Analítica de uso
Por último, se ha implementado un cuadro de mando con una analítica de uso. Para ello el sistema almacena la actividad realizada por cada persona: lo que pregunta y lo que el sistema contesta, así como el camino seguido en las sucesivas interacciones. Esta información permite al Ayuntamiento evaluar la bondad de la solución.
Conclusiones
Una vez concluida la elaboración del prototipo se ha sometido al mismo a una batería de pruebas, tanto a través de altavoces inteligentes como de móviles y, usando éstos como dispositivos, tanto con la app Alexa como con Twitter.
El control de los tiempos tomados para realizar una misma interacción a través de herramientas convencionales tales como el Visor Urbanístico, por un lado, y a través del prototipo, por otro, pone de manifiesto una mejora cuantitativa de en torno a un 80%. A esta reducción drástica de tiempos hay que añadir las mejoras cualitativas propias de usar la voz como interfaz con nuestros sistemas informáticos.
Con todo ello se demuestra que es factible prestar unos servicios públicos a la ciudadanía como nunca antes habíamos soñado, con un alineamiento tecnológico pleno con la sociedad.
Se puede acceder a un vídeo demostrativo del uso del prototipo a través de http://run.gob.es/PrototipoCibeles.