Presiona "Enter" para comenzar tu búsqueda

¿Realmente sabemos qué es el Big Data?

  • Por Arturo Peralta Martín-Palomino
  • 13 abril 2018

En pleno 2018 a nadie sorprende ya el término “Big Data”. Prácticamente todo profesional o estudiante de cualquier disciplina ha oído hablar de ello y cada uno es capaz de dar una descripción, o mejor dicho, su interpretación sobre el concepto, sus límites o su finalidad. Sin embargo, ¿realmente sabemos qué es el Big Data?

No es el objetivo de este post realizar una definición formal y exhaustiva del término ya que actualmente resulta muy sencillo encontrar en la web miles de referencias con distintos niveles de profundidad y en lenguajes idóneos para cualquier público. Es por ello que preferiría centrarme en valorar qué se entiende habitualmente por Big Data y en algunos de los problemas derivados de una interpretación incorrecta o incompleta.

Desde el inicio de mi vida profesional, ya sea por motivos académicos o laborales en la empresa privada, he estado vinculado a distintas parcelas pertenecientes al Big Data y he  podido discutir acerca del potencial del Big Data con estudiantes y profesionales de distintos ámbitos. Por supuesto, en muchas de esas charlas he podido aprender muchísimo y continuar reforzando mi conocimiento sobre esta área, pero en la mayoría de los casos he detectado que realmente buena parte de la población tiene una visión sesgada o incompleta.

De hecho, en la  mayoría de los casos, Big Data parece ser entendido “simplemente” como el conjunto de soluciones, herramientas o algoritmos capaces de permitir almacenar y recuperar altos volúmenes de datos, centrándose por tanto esencialmente en el problema arquitectural que gestionar grandes cantidades de datos supone. Efectivamente resolver esta problemática mediante procesos de indexado avanzados, arquitecturas en clúster o los tipos de bases de datos ideales para la naturaleza del problema resulta uno de los puntos clave a afrontar por las llamadas “técnicas para gestión de Big Data”, pero Big Data es mucho más que ello. Posiblemente esta típica asociación en exclusiva con el problema técnico que supone trabajar  con altos volúmenes de datos y con una velocidad adecuada se deba en buena parte a la traducción rápida del propio término, pero debemos tomar en cuenta que mediante estas técnicas podemos enfrentarnos al reto que supone trabajar con datos en variedad de formatos, donde la veracidad de los mismos debe ser asegurada, y con el objetivo final de extraer un valor que de otro modo quedaría oculto. Es lo que habitualmente se conoce como las 5 V’s del Big Data: Volumen, Velocidad, Variedad, Veracidad y Valor.

1

Es decir, mediante la gestión y el análisis de Big Data no sólo deberíamos ser capaces de poder obtener rápidamente el resultado de una consulta sobre un conjunto de datos si no también, por ejemplo, detectar patrones de comportamiento de nuestros clientes, identificar nuevas demandas u oportunidades, realizar estimaciones más certeras o anticiparnos a posibles conflictos con el objetivo, en definitiva, de permitirnos ser más competitivos y eficientes. En este contexto técnicas clásicas englobadas dentro del ámbito de la Inteligencia Artificial como el Machine Learning, el Deep Learning o el KDD, sin necesidad de haber sido rebautizas con ningún otro nombre más “cool”, pueden resultar clave para explotar todo su potencial al ser aplicadas sobre un buen conjunto de datos sin la obligatoriedad de contar con Terabytes o Petabytes de información, siendo por tanto aplicable en empresas de cualquier tamaño.

En definitiva actualmente tanto el concepto de Big Data como la necesidad de la implantación de estrategias para su gestión en el ámbito empresarial, parecen haber sido completamente asimilados. Sin embargo resulta importante refrescar su significado real, desde las distintas perspectivas implicadas, para evitar su encasillamiento en ciertos sectores o tipos de empresa. Todos tenemos a nuestro alcance obtener algún provecho del Big Data, no lo desperdiciemos.

Dr. Arturo Peralta Martín-Palomino

Profesor del Máster en Big Data y Data Science (VIU)