Investigadores de Cataluña desarrollan un sistema de protección de datos confidenciales en documentos

El sistema desarrollado por los investigadores permite ocultar de manera automática los datos confidenciales de los documentos.

Un sistema de protección de datos capaz de detectar y ocultar automáticamente la información confidencial de documentos de texto es el resultado de las investigaciones llevadas a cabo por Montserrat Batet, de la Universitat Oberta de Catalunya (UOC), y David Sánchez, de la Universitat Rovira i Virgili (URV).

El sistema desarrollado por los investigadores permite ocultar de manera automática los datos confidenciales de los documentos.

El método que han desarrollo permite enviar documentos a terceros sin comprometer la privacidad y manteniendo el anonimato de las entidades y personas a que hacen referencia. Hasta ahora, la protección de documentos confidenciales requería de uno o varios expertos que, manualmente, identificaban y eliminaban palabras, sintagmas o frases que podían revelar información sensible o potencialmente discriminatoria.

Automatiza el proceso de protección de datos

En este proceso se tienen en consideración tanto términos sensibles, como por ejemplo el nombre de una enfermedad contagiosa, como también conjuntos de términos que permitirían deducir los anteriores indirectamente, como por ejemplo, combinaciones de medicamentos o tratamientos que solo se aplican en una enfermedad concreta. Según explica la UOC, trabajar con tales elementos implica una tarea ardua y que no siempre es infalible debido a su complejidad.

El método que han desarrollado automatiza todo este proceso, cosa que permite manejar y proteger eficientemente el gran volumen de datos que se usa actualmente en investigación. Para hacerlo, el sistema analiza la información disponible en Internet, que es la que un tercero podría usar como base de conocimiento para deducir información confidencial de un documento protegido. Y a continuación protege aquellos términos que podrían facilitar esas deducciones.

Prototipo de software

Las pruebas han demostrado que este método es más exhaustivo y ofrece una precisión equiparable a la de un experto humano. Además, a diferencia de los expertos, el sistema no se limita a eliminar términos peligrosos, sino que también intenta, siempre que se pueda, reemplazarlos por conceptos más generales que resulten más ambiguos. Por ejemplo, en lugar de especificar que un paciente tiene una neumonía, se indicaría que sufre una enfermedad del sistema respiratorio. Con esto se consigue que el documento protegido sea más comprensible y resulte más útil en los análisis posteriores que si se eliminasen términos.

De momento, el método se ha implementado en un prototipo de software que se ha probado sobre documentos clínicos en inglés. Se prevé que en un futuro próximo pueda aplicarse a otros ámbitos de conocimiento y pueda establecerse como una herramienta de uso profesional de especial utilidad para la investigación.

 
 
Patrocinio Plata
Patrocinio Bronce
Salir de la versión móvil