El cataclismo de los datos o nuestra pérdida de privacidad

Share Button

Hay veces que las noticias parecen aliarse en el tiempo y salen a la luz en un corto periodo de tiempo varias relacionadas entre sí. Justo cuando aún colea el ya archidenostado experimento psicológico de Facebook, descubrí ayer por ejemplo un interesante libro publicado por el matemático estadounidense Christian Rudder titulado «Dataclysm: who we are when we think no one’s looking» (Dataclismo, quiénes somos cuando pensamos que no nos miran). Rudder es uno de los fundadores de la red social de contactos OkCupid, creada en 2004, y responsable a su vez del blog OkTrends, donde analiza estadísticamente el comportamiento de los usuarios de dicha red social. Precisamente los principales artículos publicados en el blog han tomado ahora la forma de libro.

dataclysm-libro

El «dataclismo» (o cataclismo de los datos) no es otro que la gran cantidad de información que poseen sobre nosotros las empresas de Internet. Analizando nuestro comportamiento en Internet, como qué páginas web visitamos, quiénes son nuestros amigos en redes sociales, qué buscamos en Google, etc., nos estamos definiendo como un Yo Digital. En definitiva:

Dime a qué páginas les das a ‘Me gusta’ y te diré cómo eres.

Algunas de las curiosas ideas que defiende Rudder no hacen sino poner negro sobre blanco alguno de los tópicos sexuales más conocidos, a saber: que los usuarios varones las prefieren jóvenes, mientras que ellas los prefieren de su misma edad. Otros resultados son cuanto menos sorprendentes, pues se atreve a pronosticar que buena parte de la población homosexual de algunos estados de Estados Unidos permanece ‘en el armario’, ya que no se corresponde la tasa de personas que viven abiertamente su orientación sexual según las encuestas con el porcentaje de búsquedas en el buscador Google sobre esta temática.

Sea como fuere, estas conclusiones de OkCupid no dejan de ser el resultado de análisis de datos proporcionados libremente por los usuarios inscritos en dicha red social. Sin embargo, al igual que ocurre con la difracción de la luz, el poder de las tecnologías Big Data puede franquear obstáculos, doblar esquinas y extraer información oculta en la más inmensa de las oscuridades.

Y es que como decía que a veces las noticias vienen juntas, ayer también se hizo público en El País un estudio científico de investigadores suizos, Emre Sarigol y Frank Schweitzer, junto al español David García, sobre una red social ya extinta, Friendster, pero preservada para la posteridad por el proyecto Archive. Analizando los datos sobre la orientación sexual de los perfiles publicados allí, los autores del trabajo han calculado lo que denominan ‘perfiles fantasma’. Es decir, han conseguido deducir datos sexuales que los usuarios no habían desvelado públicamente, e incluso datos de personas que ni siquiera tenían perfil en dicha red social.

Los investigadores utilizan el concepto de teoría de redes de asortatividad para este estudio. Básicamente es la preferencia de los nodos de una red para agruparse con otros nodos similares. Dicho en román paladino:

Dime con quién andas y te diré quién eres.

En la práctica quiere decir que los usuarios con una determinada orientación sexual tienden a tener más relaciones de amistad con otros usuarios de la misma orientación sexual, incluso aunque esta no haya sido revelada por los mismos. Y así es como consiguen predecir esta información mediante complejos modelos matemáticos. Por cierto, el artículo publicado puede encontrarse en la web de los autores.

red-social-sarigol-garcia-schweitzer

Aspecto de la red social Friendster según los autores del estudio Sarigol, García y Schweitzer

Ni que decir tiene que la Ley Orgánica de Protección de Datos de carácter personal (15/1999, de 13 de diciembre) establece que los datos sobre la vida sexual, al igual que las ideas políticas, creencias, origen étnico o la religión, son datos sensibles con especial protección. Ciertamente este tipo de datos no puede recabarse o tienen muy restringido su uso, salvo por «razones de interés general» y siempre con el consentimiento expreso del afectado.

Pero esto nos lleva a un dilema: el estudio científico mencionado anteriormente habrá tenido que anonimizar los datos para no inferir información de especial carácter sensible de personas especifícas, y como a todo estudio científico, se le presume buena fe por el bien de la Ciencia y de la Humanidad. Pero me pregunto, ¿esta precaución de anonimación es suficiente?

¿Qué impide que empresas generales, que por tanto no se mueven por el afán científico sino por meros ánimos de lucro, utilicen las mismas técnicas de Minería de Datos a las redes sociales, ya sea de manera lícita por ser de acceso público, o bien utilizando técnicas hacker, para conocer información que ni siquiera han desvelado los usuarios? ¿Acaso se nos ha olvidado ya la famosa fuga de datos de AOL de 2006, gracias a la cual diversos usuarios de dicho portal estadounidense pudieron ser identificados y localizados gracias a su desvelado historial de búsquedas, a pesar de que los datos estaban anonimizados? ¿Somos conscientes de en qué manos están nuestros datos? ¿Hasta donde llega el ‘Gran Hermano’?

Cuando los tambores de guerra sobre la ventas de datos personales privados azota también a Facebook, se hace cierta la máxima de la Publicidad y el Marketing del siglo XXI:

Cuando el producto es gratis, el producto eres tú.

Veremos.

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *