Estos días se han publicado artículos en diversos medios hablando sobre cómo el Instituto Nacional de Estadística ha pactado con las operadoras realizar un estudio sobre movilidad empleando información anónima obtenida de los operadores a partir de la localización de sus abonados.

Nueva polémica sobre la privacidad de tus datos, y esta vez salpica a los operadores españoles y a tu propio móvil. El Instituto Nacional de Estadística, el INE, comenzará en tres semanas una operación de seguimiento de los móviles de los españoles para conocer con más exactitud sus hábitos de movilidad y poder actuar conforme a cómo se mueven los ciudadanos.

Artículo en El Confidencial

Antes de ahondar en algunos aspectos, podemos destacar lo siguiente:

  • No se trata de una actividad nueva de las operadoras.
  • Los datos son recopilados originalmente por las operadoras durante la prestación del servicio a sus abonados
  • Dichos datos son posteriormente anonimizados una vez ya no son necesarios para dicha prestación
  • Los datos son agregados dividiendo el territorio en celdas con un número mínimo de abonados elevado para dificultar identificación incluso en zonas con densidades bajas de población. Es el resultado de dicho trabajo lo que recibirá el INE
  • El muestreo se realiza con una separación horaria importante, que puede dificultar un análisis realmente eficaz
  • Las características de la información pueden provocar sesgos e información estadística no adecuada para las finalidades buscadas

Luca, Insights y los servicios de las operadoras

Lo primero que debemos tener en cuenta es que las operadoras llevan ya un tiempo tratando este tipo de datos, y así podemos encontrar mención en la presentación de Luca de Movistar

La primera línea de servicios se apoya principalmente en el valor para todo tipo de clientes de los datos anonimizados y agregados de las redes de Telefónica. En esta categoría se incluyen servicios ya existentes como Smart Steps enfocado en soluciones de gestión de la movilidad para una planificación más eficiente por ejemplo de los servicios de transporte y turísticos en las ciudades o, en el caso de una emergencia sanitaria, en ayudar a entender mejor los movimientos de la población y limitar la propagación de pandemias.

Presentación del servicio Luca

También podemos mencionar el equivalente de Orange, y su alianza con Geoblink en el artículo de Europa Press «Orange se une a Geoblink para desarrollar herramientas de Big Data para el análisis de flujos de población«

De hecho, esta información ha sido utilizada en artículos como el de El País titulado «De dónde son los españoles que veranean en Benidorm (y en otros 55 destinos)«

Geoblink usa algoritmos para buscar patrones de movimiento: residentes, trabajadores, visitantes, veraneantes. Luego los agrega por código postal y obtiene una granularidad con una precisión difícil de encontrar. Para cumplir con el Reglamento Europeo de Protección de Datos, nunca desciende hasta lugares donde pueda identificarse el movimiento de individuos concretos.

Artículo de El País

Dicho todo lo anterior, que ya se viniera haciendo no lo convierte automáticamente en un uso legítimo, y habrá que ver las características concretas de este caso.

¿Qué datos podrá obtener el INE?

En el artículo de El País «las operadoras cobrarán medio millón de euros por ceder los datos al INE» los responsables de Vodafone indican lo siguiente:

Solo obtenemos información de que X dispositivos están conectados en la hora H en la antena Z. No recogemos ninguna información más

En el mismo artículo encontramos más información sobre el procedimiento que se llevará a cabo y su resolución

Para elaborar esta estadística el INE dividirá el territorio nacional en 3.500 celdas con un mínimo de 5.000 personas en cada una de ellas. De esta forma, los tamaños de los recuadros varían: las celdas se vuelven muy grandes en áreas con poca población y se van haciendo mucho más pequeñas en lugares con alta densidad de habitantes

Esta división por un lado dificultará un análisis efectivo, especialmente en áreas con baja densidad, pero dificultará la reidentificación de sujetos incluidos en los conjuntos. Dicho esto, debemos recordar que, en origen, se trataba de datos pertenecientes a dispositivos concretos.

¿Puedes oponerte al tratamiento?

En este caso tenemos dos posibles interpretaciones. En primer lugar debemos recordar lo indicado en el Considerando 26 del Reglamento de Protección de Datos

Por lo tanto los principios de protección de datos no deben aplicarse a la información anónima, es decir información que no guarda relación con una persona física identificada o identificable, ni a los datos convertidos en anónimos de forma que el interesado no sea identificable, o deje de serlo. En consecuencia, el presente Reglamento no afecta al tratamiento de dicha información anónima, inclusive con fines estadísticos o de investigación.

Considerando 26 del RGPD

Si vamos a la Ley 9/2014, de 9 de mayo, General de Telecomunicaciones, dentro de los derechos de los usuarios finales de los servicios de comunicaciones electrónicas del Art. 48 podemos encontrar lo siguiente:

A que sólo se proceda al tratamiento de sus datos de localización distintos a los datos de tráfico cuando se hayan hecho anónimos o previo su consentimiento informado y únicamente en la medida y por el tiempo necesarios para la prestación, en su caso, de servicios de valor añadido, con conocimiento inequívoco de los datos que vayan a ser sometidos a tratamiento, la finalidad y duración del mismo y el servicio de valor añadido que vaya a ser prestado. Los usuarios finales dispondrán del derecho de retirar su consentimiento en cualquier momento y con efecto inmediato para el tratamiento de los datos de localización distintos de tráfico

Art. 48 de la Ley 9/2014

La postura al respecto de permitir la oposición de los abonados es distinta dependiendo de la operadora, pudiendo así observar cómo Vodafone permite desactivar dicha cesión incluso tras anonimización y agregación

Oposición a la cesión de datos anonimizados en Vodafone

Algo similar podemos encontrar por ejemplo en Lowi

Opción para no autorizar la cesión de datos anonimizados a terceros

En el caso de Movistar, la empresa ha hecho pública una nota de prensa sobre el estudio de movilidad del INE, del que podemos destacar lo siguiente:

Todo ello de conformidad con la normativa de Protección de Datos, la cual no resulta de aplicación a la información anónima inclusive con fines estadísticos o de investigación, es decir, información que no guarda relación con una persona física identificada o identificable, ni a los datos convertidos en anónimos de forma que el interesado no sea identificable, o deje de serlo

Los datos que forman parte de este proyecto son anonimizados y por tanto no sería aplicable la normativa de protección de datos, no siendo necesario el consentimiento del usuario para ello.

Nota de Movistar sobre el estudio de movilidad del INE

De hecho, en el centro de privacidad de Movistar podemos encontrar más información al respecto de la anonimización de los datos de sus abonados

Con estos datos anónimos, el Grupo Telefónica realiza Proyectos Big Data en los que conjuntos de datos o combinaciones de conjuntos de datos de gran volumen y complejidad, son procesados mediante tecnologías y herramientas que permiten obtener resultados estadísticos de utilidad.

Por otro lado, los datos se analizan con el objetivo de obtener resultados, siempre de manera agregada, con el fin de identificar comportamientos de carácter general y nunca de carácter individual. Una vez agregados, los datos son extrapolados estadísticamente para realizar una estimación sobre el número total de personas, para no tener en cuenta solo aquellos que están conectados la red de Telefónica. Por todo lo anterior, dado que los datos están anonimizados, agregados y extrapolados, es totalmente imposible identificar de manera individual a las personas que generaron dichos datos.

Por lo tanto, en el caso de Movistar podemos extraer de la nota de prensa que al llevar a cabo la anonimización de los datos por imperativo legal una vez prestados los datos, su incorporación y posterior tratamiento agregado quedaría fuera del ámbito de protección de la normativa de protección de datos. Si damos por válida esta interpretación, una vez anonimizados escaparían a la aplicación de la normativa de protección de datos y, por tanto, no sería necesario buscar la base legal de entre las contempladas por el Reglamento, ni tener en cuenta las actuaciones llevadas a cabo por el titular de los datos. Ahora bien, ¿realmente anonimizan los datos con todas las garantías?

Si acudimos al código de buenas prácticas en materia de protección de datos de la Agencia Española de Protección de Datos podemos ver que se nos indica lo siguiente:

En virtud de lo anterior, conforme a lo indicado por el GT29, es necesario realizar una evaluación de las técnicas y procedimientos de anonimización utilizados, a fin de acreditar que la disociación realizada evita que: (i) se pueda identificar a una persona física dentro de un conjunto de datos; (ii) se pueda relacionar o enlazar la información de una persona física a partir de la vinculación de dos registros dentro de un conjunto de datos (o entre dos conjuntos de datos independientes); o (iii) se pueda inferir cualquier información sobre la persona física en un conjunto de datos.

Código de buenas prácticas en Big Data

Pero aquí tenemos que tener en cuenta además diversos factores que dificultan que esto pueda realizarse fácilmente:

  • Esta evaluación la deberán realizar las operadoras respecto a los conjuntos de datos con que operan, y las tecnologías con que cuentan. Una cosa es que al INE le pasen datos agregados a baja resolución, y otra es el conjunto de datos con el que trabajan de fondo las operadoras para poder ofrecer dicha información.

A este respecto, recordemos otro tema mencionado en la Guía de la AEPD

Las técnicas de anonimización deben preservar la utilidad de los datos en la medida de lo posible, sin perder de vista el impacto que puede tener la utilización de las mismas, especialmente en el caso de elaboración de perfiles

Código de buenas prácticas en Big Data
  • Las operadoras cuentan potencialmente con múltiples conjuntos de datos que les permitiría la reversión de la anonimización si no se lleva a cabo el proceso con todas las garantías.

Por lo tanto, habría que comprobar si los conjuntos de datos que la operadora utiliza para facilitar dicha información realmente cumplen con los requisitos adecuados de anonimización para escapar de la aplicación de la normativa de protección de datos, pese a que se almacenan con una granularidad suficiente para mantener su valor.

La proporcionalidad

El artículo 4.1 de la Ley 12/1989, de 9 de mayo, de la Función Estadística Pública recoge este principio dentro de los principios de la recogida de datos para llevar a cabo dicha función estadística

La recogida de datos con fines estadísticos se ajustará a los principios de secreto, transparencia, especialidad y proporcionalidad.

Art. 4.1 de la Ley 12/1989

En este caso deberíamos analizar al menos si se cumplen los siguientes requisitos:

  • La medida es apta para los fines que la justifican
  • La injerencia que se produzca es la menor posible
  • Debe realizarse una ponderación entre la carga para los derechos de los afectados y el fin perseguido

El problema aquí es que este análisis debe incluir, como hemos indicado, el análisis de si es una medida apta, y este es otro de los aspectos que (a mi parecer) pueden ser dudosos).

Un análisis del tipo planteado, y siempre atendiendo a la información que se ha hecho pública, tiene una frecuencia de muestreo tan grande, y una agregación tal, que no es muy apta para un análisis profundo de la movilidad capaz de ser una alternativa a las encuestas realizadas hasta el momento, pudiendo además crear sesgos importantes si lo damos como valores absolutos. Situaciones como movimientos pendulares, el propio tamaño de las celdas (que en determinadas zonas pueden llevar a grandes tamaños) y la baja información asociada a la localización que finalmente obtendrá hace que no sea una medida realmente eficaz, más allá de obtener más indicios. Puede ser útil para determinados análisis gruesos de censos, pero dado el coste y eficacia, no resulta la mejor alternativa.

Además de todo lo anterior, debemos al menos mencionar que mientras a algunas empresas se les hacen requerimientos importantes de información por parte del Instituto Nacional de Estadística, que se encontrarán finalmente obligados a su aportación y a dedicar recursos a ello, en este caso se opta por contratar dichos servicios a las operadoras, y por un coste que supera los gastos en que pudiera incurrir para la realización de dichas estadísticas.

¿Qué ha fallado?

Lo que sí ha revelado esta noticia es que los usuarios no son realmente conscientes de qué se hace con los datos que generan a través de sus terminales, de los que la localización es una pequeña parte, y el negocio que llevan a cabo las operadoras a partir de los mismos.

Queda claro que es necesario trabajar más la transparencia en qué se hace con los datos, tanto mientras permiten identificación como una vez anonimizados, además de reforzar la capacidad de control por parte de los abonados de la información que generan. Se ha hablado largo y tendido del control de los datos por parte de los usuarios, pero una de las plataformas que más ha mencionado dicho tema (Movistar) es precisamente la que más obstáculos pone a la oposición para la cesión de los datos ya anonimizados.

Esta era una oportunidad para tener preparada una campaña por parte del Instituto Nacional de Estadística para dejar claro a qué información iba a acceder, cómo lo iba a hacer, y cómo trabajan las operadoras con dichos datos, pero la nota de prensa que emitió tras varias horas fue excesivamente escueta y formalista

Comunicado Institucional del INE

Este tipo de actuaciones crean recelos, y es por eso que es especialmente importante el lenguaje y la transparencia desde el primer minuto. Un comunicado de este tipo tampoco es el más adecuado para esta situación.

Sergio Carrasco Mayans
Síguenos
1 comentario

    Deja un comentario

    Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.