Análisis y reporte de datos: más allá del Big Data

Muchos sabemos que Big Data es el fenómeno actual para el análisis y reporte de datos y del que todos hablan. Por eso es complicado plantearnos una alternativa de análisis de datos a gran escala donde no nos encontremos con él ahora mismo. Pero, ¿por qué no está todavía tan extendido? Pues básicamente:

  • Porque es algo nuevo y que hay que pulir. Tal vez, inmadurez.
  • Porque de momento no abundan los casos para aplicarlo. La transparencia escasea y pocos son los que están dispuestos a revelar todos sus datos públicamente.
  • Por último, dominar al 100 % los datos es muy complicado.

Pese a esta inmadurez, surgen nuevos conceptos que suponen un paso más en la estrategia de análisis y reporte de datos de una compañía. Los que vienen pisando más fuerte son el Data Lake o Smart Data.

análisis y reporte de datos

Smart Data

Cuando vemos que en Internet se generan más de 4 millones de búsquedas en Google, que se comparten millones de actualizaciones en Facebook o que en Twitter se publican más de 300.000 tuits y todo esto en 1 solo minuto, es el Smart Data quien se encarga de convertir toda esa información en inteligencia de negocio.

Y si Big Data se mantiene sobre cuatro conceptos fundamentales como son: volumen de datos, la velocidad, veracidad y variedad, el Smart Data lo que hace es que añade un variable extra: el valor de las consecuencias que se producen a la hora de tomar decisiones y ejecutarlas. Smart Data nació por la necesidad de cubrir de manera eficaz las carencias que tiene Big Data. Para resumir este concepto y hacerlo más comprensible al lector, el Smart Data no tiene en cuenta la cantidad de datos recogidos, sino que se centra en la calidad de esos datos y en el uso inteligente que se va a dar a los mismos.  Para el Smart Data lo primero es tener datos con valor y de utilidad para resolver el problema, antes que recopilar la información. Todo ello sin olvidar que Smart Data necesita la arquitectura de Big Data para cumplir este obejtivo, claro.

Data Lake

Como su nombre indica, un Data Lake es como un gran lago donde conviven peces de distintos colores, variedad y tamaños. Si lo aplicamos a los datos, lo enfocamos en meter toda la información en un único lugar. En Data Lake se almacenan los datos tal cual se generaron, conservando su formato original y sin haberlos sometido previamente a ninguna transformación o modelización. Así se garantiza mantener el aspecto  original de la información. Esta absorción masiva de información es posible porque su accesibilidad es muy grande y sus costes muy bajos, tanto en términos de software como de hardware o gestión. Hadoop es actualmente la tecnología más utilizada para crear estos “lagos de datos”.

Comparte:

Escrito por

Equipo de redacción de Solo pienso en TIC, el blog de SIAG Consulting.

Deja un comentario