17 noviembre, 2022

El Big Data también juega su Mundial

En los últimos años, mucho se ha venido hablando de Datos como ejes naturales para el análisis y la toma de decisiones a nivel empresarial. Términos como Data Governance, Data Lakes, Big Data, Data Driven o Arquitectura centrada en Datos han sido términos acuñados y muy frecuentemente utilizados en esta última década.

Muchas organizaciones han encarado proyectos de inversión relacionados con estos ámbitos, o colateralizados de otros con alta incidencia, apuntando a entender mejor a sus negocios, a sus consumidores, a optimizar infraestructura y costos, a actualizar sus procesos internos; en resumen, a optimizar la performance de su ciclo de vida, valiéndose de las nuevas herramientas analíticas que gracias a la tecnología están ahora cada vez más cerca.

Sabemos que efectuar complejos procesos estadísticos u obtener información transaccional desde grandes volúmenes de datos (propios o ajenos) no eran aspectos sencillos de obtener, analizar y mostrar tan solo unos 15 o 20 años atrás. Sea por costos, procesamiento, localización, depuración o avance tecnológico, las reconocidas 5 “V”s del paradigma actual de datos – Volumen, Velocidad, Variedad, Veracidad y Valor – sólo podían verse reflejadas en intentos aislados sobre cada una de ellas donde los resultados podían ser poco concluyentes.

Volviendo al eje principal y aprovechando la pasión que representa el nuevo campeonato mundial de fútbol, vincularemos cada uno de estos conceptos a la práctica deportiva de alto rendimiento, desde donde podremos observar que este paradigma basado en Datos, también es aplicable a muchos otros aspectos de nuestra vida cotidiana.

En los últimos años es frecuente ver atletas y deportistas, tanto profesionales como amateurs, que entrenan justamente con análisis de rendimientos basados en conjuntos de datos (data lakes) propios, de competidores, y de fuentes estadísticas externas, donde confluyen desde mediciones clínicas, de esfuerzo y rendimiento corporal, así como también condiciones del terreno de juego, climatología, calzados e indumentaria afín, entre otra diversidad de aspectos.

Es aquí donde justamente aparece el concepto de Volumen, es decir, esa “nube” de datos con la que se cuenta para iniciar cualquier análisis. Cuanto mayor sea la cantidad de datos considerados, se estima que menor será el sesgo estadístico de la muestra.

Pero dentro de esas grandes magnitudes, también aparece el concepto de Variedad, es decir, la diferente naturaleza y origen de los datos a considerar. Nos topamos aquí con magnitudes de diferentes ámbitos (por ejemplo, la temperatura corporal de un jugador vs el estado del campo de juego) que requieren ser homogeneizados, combinados o estructurados previamente para poder facilitar su procesamiento. Es parte de la esencia del Big Data poder generar configuraciones acordes en este sentido.

Otro concepto que presenta diversas acepciones es la Velocidad. Tanto en lo que se refiere a la generación y producción de datos como a su procesamiento y obtención de resultados útiles. Es decir, no sólo concentrar el esfuerzo en la pronta obtención de las mediciones, sino también en la capacidad de procesar las mismas en conjunto con las “V”s precedentes.

Un cuarto eslabón es la Veracidad de los datos, que supone uno de los mayores desafíos. Un gran volumen de información obtenido puede plantear ciertas dudas sobre la veracidad de los datos contenidos. Mediciones incompletas, incorrectas, bajo circunstancias atípicas o especiales, datos provenientes de fuentes externas no confiables, estadísticas de dudoso origen, u otras alteraciones podrían llevar a una obtención errónea de resultados, de no ser depuradas estas cuestiones en forma previa.

La quinta característica y quizás la fundamental de todo este proceso es el Valor, es decir el valor que generan los datos, una vez convertidos en información para la toma de decisiones. En el ejemplo de orden deportivo que seguimos, tienen varias lecturas: desde la oportunidad individual de cada deportista en superarse hasta la estrategia de un entrenador en el armado de un equipo considerando estos factores. A nivel empresa, esto se traduce en sacar el máximo partido a los datos para optimizar la gestión de negocio, alcanzar una ventaja competitiva, entre otros objetivos superlativos.

Por último, me gustaría incorporar a modo personal una sexta “V”, que es quizás de orden subjetivo, y es la Voluntad. La voluntad de cambio y de atreverse a dar el paso que representan estos desafíos en un contexto tecnológico que va facilitando estas posibilidades. Los avances tecnológicos no esperan a una organización, sea esta una empresa o una entidad deportiva o incluso a una persona. Sin este componente aglutinante, sin la voluntad expresa de emprender el acompañamiento hacia la permanente evolución digital, cualquier intento parcializado puede resultar en vano.

Por Gustavo Fornari, Gerente General Liveware I.S.