tribuna abierta

De Big Data a Big Brother

15.08.2013 | 02:00

En el año 2002, Billy Beane, director técnico de los Oakland Athletics, un equipo de béisbol estadounidense, tuvo que afrontar un doble problema: la marcha de sus principales estrellas a otros clubes más poderosos y un escaso presupuesto para recomponer la plantilla. Lejos de resignarse, Beane contrató como ayudante a Paul DePodesta, un joven licenciado en Económicas por Harvard que había desarrollado un sistema de análisis de datos que permitía saber qué jugadores tenían un enorme potencial para armar un equipo ganador. El sistema analizaba lo que cada uno podía aportar al conjunto, aunque fueran desconocidos o estuvieran devaluados económicamente.

El resultado de aquel experimento lo describe, con algunas licencias sobre la historia real, la película Moneyball, protagonizada por Brad Pitt: los Oakland Athletics acabaron funcionando como un reloj suizo gracias al método de DePodesta (caracterizado como Peter Brand en la película) y establecieron un récord en la MLB (20 victorias consecutivas), llevándoles a ganar aquel año la liga regular de la división oeste, aunque cayeron en los play-off de postemporada.

Aquel episodio, que recogen el profesor de la Universidad de Oxford Viktor Mayer-Schönberger y el editor de datos de The Economist, Kenneth Cukier, en su libro Big Data: A Revolution That Will Transform How We Live, Work, and Think (en español, publicado por Turner Editorial: Big Data: La revolución de los datos masivos), es tal vez la demostración más palpable, aunque en una fase aún embrionaria, del poder del análisis de grandes volúmenes de datos para crear modelos predictivos, una tendencia en el sector de la tecnología de la información que crece de manera vertiginosa, trayendo consigo incuestionables ventajas, pero también un preocupante lado oscuro.

Un ejemplo sencillo del uso del Big Data lo tenemos hoy en día, por ejemplo, en Amazon, que es capaz de relacionar su mastodóntica base de datos, para extraer patrones conductuales y, tras una compra, sugerirnos otros libros o productos relacionados con el que hemos adquirido, no sólo por nuestro historial, sino por el comportamiento previo de otros miles de usuarios.

Otro ejemplo lo tenemos en el análisis informático de datos públicos y propios que el equipo de Obama hizo en las pasadas elecciones presidenciales, aunando estadística e inteligencia artificial para obtener patrones de conducta y lograr trasladar un mensaje personalizado a cada ciudadano, que recogiera exactamente aquello que quería escuchar, atendiendo a sus problemas y preocupaciones.

O el caso, por poner otro ejemplo entre miles, de la filial de T-Mobile en EEUU, que para reducir la portabilidad, analizó los millones de datos que poseía sobre la actividad de sus clientes y extrajo modelos de comportamiento que le alertaban de cuándo un usuario estaba a punto de irse a otra compañía y poder anticiparse a su decisión. T-Mobile consiguió reducir un 50% el número de portabilidades.

Llevado a gran escala, el poder del Big Data es enorme. Analizando patrones de conducta de millones de personas y cruzando datos de miles y miles de fuentes, es posible desde mejorar la coordinación tras una catástrofe hasta incluso poner en marcha métodos de reducción de la delincuencia o el terrorismo, basándose en patrones que anteriormente desembocaron en robos o episodios de violencia.

Pero como decía, el Big Data lleva consigo la otra cara de la moneda, una zona oscura que pone sobre la mesa riesgos de igual peso que las virtudes que puede aportar, fundamentalmente en dos cuestiones.

Una, de raíz más antropológica, centrada en el peligro de lo que Evgeny Morozov denomina la "renuncia al porqué": ya no necesitamos comprender por qué sucede algo, no necesitamos saber por qué una persona se comporta como un delincuente o terrorista, sino simplemente, con las correlaciones de datos, incidir en la conducta preventiva para evitar a tiempo que cometa algún acto de delincuencia; conectar el comportamiento de los terroristas de hoy con los de mañana para incidir en la localización de un sospechoso (o futuro sospechoso, al estilo Minority Report).

El problema de la prevalencia del cuándo y el cómo sobre el porqué es que se renuncia a atacar las causas: una acción preventiva sobre delincuencia en un barrio alejará a los sospechosos a otras zonas o dificultará más su acción, pero no se atacará el problema de raíz. Los delincuentes seguirán igual de frustrados y nunca se comprenderá si la delincuencia ha surgido por estigmatización temprana, desintegración familiar, consumo de drogas u otras causas. Este tipo de solución lleva, según sostiene Mark Andrejevic en su libro Infloglut, a una ceguera que los gobiernos democráticos no pueden permitirse, porque imposibilita cualquier reforman política seria.

Y el otro problema es el de la privacidad, tanto en la obtención de esos datos, como en el almacenamiento y venta posterior. Para poder interpretar millones de datos, primero hay que poseerlos y la verdadera lucha de las empresas dedicadas a obtener datos estará en conseguir el mayor volumen de datos de cada uno de nosotros; llegar donde los demás aún no han llegado.

Y cuántos más datos se acumulan de nosotros, más posibilidades existen de ser vendidos o robados o de que alguien haga mal uso de ellos. Las relevaciones de Snowden, de ser ciertas, ponen de manera evidente sobre la mesa el alcance del riesgo: la ruptura absoluta del equilibrio entre seguridad y privacidad. De no acotar este riesgo, el Big Data puede convertirse en poco tiempo en un verdadero Gran Hermano, en un modernizado Big Brother orwelliano. Eso, si no ha empezado a serlo ya.

Enlaces recomendados: Premios Cine