El Big Data

Día PD 2015

En los últimos tiempos no deja de mencionarse un nuevo fenómeno denominado Big Data, que dicen cambiará nuestras vidas. Lo cierto es que suena bastante bien, como casi todo lo que denominamos en inglés, pero ¿qué es?, ¿ante qué nos encontramos?

El Big Data podríamos definirlo como el tratamiento masivo de datos en un sentido amplio, abarcando a todo tipo de datos, ya sean personales o no. Doug Laney fue el primero en utilizar la teoría de las “uves”, según la cual las características del Big Data son tres: manejar un gran volumen de información, procesar datos a gran velocidad e integrar una gran variedad de fuentes de información, algunos otros autores han ido añadiendo otras “uves”, valor, sin duda los datos tienen un valor económico, “veracidad” los datos han de ser veraces, etc..

Por tanto, nos encontramos ante gigantescas cantidades de datos digitalizados que son controlados, por empresas, gobiernos y otras organizaciones, que tienen que poseer una tecnología lo suficientemente avanzada para que su tratamiento les permita realizar todo tipo de análisis de los mismos a través de algoritmos. Una de las primeras conclusiones que podemos extraer es que la información derivada del Big Data no puede ser procesada o analizada utilizando las herramientas tradicionales que conocemos.

Sin duda, el avance de las tecnologías en pocos años ha supuesto un cambio radical respecto al volumen de información generada y su almacenaje. Hoy en día, el coste de almacenar datos digitales es mínimo, la capacidad de los equipos informáticos cada vez es mayor, atrás quedan las pocas “k” con las que contaban los primeros ordenadores personales. Cada uno de nosotros, a nivel particular, puede ser un gran almacén de información, por tanto, qué no será una gran multinacional como Telefónica.

Respecto a la velocidad nos referimos a la frecuencia con la que los datos se generan, almacenan y comparten. Lo cierto es que cada vez se genera más información, ésta se almacena y comparte, pero con la peculiaridad de que este proceso se realiza a mayor velocidad.

Podemos concluir, por tanto que el Big Data es una herramienta o sistema que va a dar como resultado una predicción sobre la que se pueden tomar unas decisiones. Esas predicciones pueden afectarnos de forma positiva, en un sentido amplio, como miembros de una sociedad, pero también, nos puede afectar en un sentido negativo, cuando esas previsiones nos afecten directamente y puedan ser utilizadas para permitirnos o denegarnos el acceso a un bien o a un servicio. Nos encontramos, en este caso, ante una verdadera amenaza y peligro que el Big Data puede llegar a plantear sobre nosotros como individuos.

Ejemplos

Hasta este momento, todo lo que hemos señalado, puede escapar a nuestras mentes, vamos a indicar a continuación unos ejemplos que nos servirán para comprender ante qué nos enfrentamos. Comenzaremos con un ejemplo positivo de las ventajas de utilizar el tratamiento masivo de datos y posteriormente pondremos un ejemplo que puede suponer una amenaza.

Google tiene implementada una herramienta denominada “Google Flu Trends” que a través del análisis de los términos de búsqueda de su buscador pueden ofrecer información sobre cómo evolucionará la gripe en el mundo. A este respecto, señala Google que: “Hemos descubierto que ciertos términos de búsqueda sirven como buenos indicadores de la actividad de la gripe…. Cada semana, millones de usuarios de todo el mundo buscan información sanitaria online ….. Hemos descubierto que existe una estrecha relación entre el número de personas que realizan búsquedas relacionadas con la gripe y las personas que realmente sufren síntomas gripales. Obviamente, no todas las personas que buscan “gripe” están enfermas, pero cuando se suman todas las búsquedas relacionadas con esta enfermedad surge un patrón. Al comparar nuestros recuentos de consultas con los sistemas tradicionales de seguimiento de la gripe, hemos descubierto que las consultas suelen ser muy frecuentes justo en la temporada de auge de esta enfermedad. Mediante el recuento de la frecuencia de estas consultas, podemos estimar en qué medida circula la gripe por diferentes países y regiones de todo el mundo.” Podríamos considerar a éste, como un claro ejemplo del tratamiento de datos masivos, en el que existe una gran cantidad de información, y un procesamiento de la misma a gran velocidad da como resultado a su vez a una información que ayudará a los países a planificar a sus servicios sanitarios públicos para afrontar la gripe, destinando los recursos necesarios allí dónde y cuando se necesiten, ahorrando millones de euros a las ahora mal trechas arcas de los Estados.

Respecto al ejemplo negativo, vamos a utilizar un artículo publicado en 2010, en el diario americano “The Wall Street Journal”, sus autores, Leslie Scism y Mark Maremont analizan lo que está sucediendo en las compañías de seguros de salud de Estados Unidos. El título del artículo es bastante descriptivo “La bola de cristal 2.0 de las compañías de seguros”. Sin analizar un caso concreto, de su lectura se desprende cierto temor de hacia dónde nos encaminamos, por eso consideramos que se deben acotar esas “predicciones” cuando su resultado afecte de forma negativa a una persona sin analizarla como un individuo particular, si no basándose en una previsión. Mostramos a continuación un extracto del mismo.

“Las aseguradoras llevan mucho tiempo recurriendo a análisis de orina y sangre para calibrar la salud de sus clientes; un proceso costoso. Hoy en día, sin embargo, las firmas de recolección de datos cuentan con dosieres tan amplios de la mayoría de los consumidores de Estados Unidos —detalles sobre sus compras en Internet, compras de catálogos, suscripciones a revistas, actividades de ocio e información de sitios de redes sociales— que algunas aseguradoras están estudiando si esta avalancha de datos puede revelar casi tanto sobre una persona como un análisis de laboratorio.

En una de las pruebas de mayor alcance, la división de EE.UU. de la aseguradora británica Aviva PLC evaluó 60.000 solicitudes de seguro recientes. El estudio halló que un nuevo sistema “de modelo predictivo”, basado parcialmente en datos de marketing al consumidor, es “persuasivo” en su capacidad de imitar técnicas tradicionales.

Estas investigaciones representan una extraordinaria expansión del uso de datos de marketing al consumidor, tradicionalmente limitados a la publicidad.

Cada vez es más fácil obtener estos datos en la web, y a menudo los consumidores apenas tienen una vaga noción de que se están recolectando y recopilando datos independientes sobre ellos que llegan a configurar un perfil sorprendentemente revelador. El creciente comercio de la información personal es el tema de una investigación de The Wall Street Journal sobre la privacidad en Internet.

Una parte clave del estudio de Aviva, realizado por Deloitte Consulting LLP, consistía en estimar el riesgo de las personas a contraer enfermedades como alta presión sanguínea y depresión. El modelo de Deloitte asume que muchos problemas de salud están relacionados con factores de estilo de vida, como los hábitos de ejercicio o el consumo de comida basura.”

Creemos que este artículo es bastante clarificador y nos muestra hacía donde se dirigen las grandes compañías de seguros. Nos preocupa la utilización de datos de carácter personal, para fines distintos para los que se recogieron; nos preocupa el lugar donde queda el consentimiento de las personas para el uso de sus datos personales; nos preocupa la información que se transmite al usuario y si ésta es clara y le advierte de las consecuencias de permitir la utilización de sus datos; nos preocupa que no exista un control, de esas herramientas y de los algoritmos que las hacen funcionar; nos preocupa que no se facilite a las personas el ejercicio de sus derechos de acceso, rectificación, cancelación y oposición . Como se observa nos preocupan muchas cosas.

Lo cierto es que parece que con la llegada del Big Data, nuestras principales armas como titulares de nuestros datos y que servían entre otras cosas, para salvaguardar nuestra privacidad, se están diluyendo. ¿Hasta dónde llegaremos?

Javier López Alonso

javierlopez@gmdelyser.com

GMDelyser Abogados

Share This