Por Sergio Ughetto, Smart Business Unit Director de Omega Peripherals
—
Supongamos que necesitas una serie de datasets para elaborar un determinado producto de Data Analytics para tu empresa.
Es muy probable que tengas una solución de BI basada en Data Warehouses o Data Lakes. Te encontrarás que los datos disponibles han sido construidos para responder a algunas preguntas de negocio, pero que estas están limitadas al BI y reporting, por lo que funcionan como silos que proveen algún tipo de información para un área específica.
El acceso a estos datos es a través de las herramientas de consulta o extracción de datos de los Data Warehouses o Data Lakes. Si requieres más información, los procesos son largos y complejos, generalmente se tardan meses en incluir nuevos datos.
En esta modalidad los usuarios y las usuarias de negocio deben solicitar al equipo de IT que les construyan los dashboards o reports que necesitan. Así, se van creando diferentes Data Marts para ir resolviendo las solicitudes de las diferentes áreas o departamentos.
Los datos deben ser cargados construyendo workflows, bien con herramientas de carga o con el desarrollo de procesos. El problema es que estos datos cargados están definidos en terminología de IT, no de negocio, es difícil navegar por ellos y complejo extraer valor.
Generalmente los datos no están actualizados en tiempo real, sino que normalmente se actualizan una vez al día y, muchas veces, se necesitan capacidades de programación para poder explotarlos, lo que condiciona el uso y el acceso a los mismos por parte de las personas que necesitan utilizarlos.
Veamos ahora una situación distinta, imagina que tu experiencia recopilando datos es similar a la de comprar en un supermercado, de manera que tomas tu carrito de la compra y comienzas a caminar por distintas estanterías (fuentes de información) buscando los datos que necesitas y curioseando otros que están disponibles.
Imagina que esos datos ya están libres de errores, que cuentan con las políticas de acceso bien definidas y que cumplen todos los aspectos regulatorios y de auditoría. Imagina que los datos están protegidos por técnicas de Blockchain y gestionados por smart contracts, y que los datasets están definidos en términos de negocio utilizando el glosario corporativo.
Imagina que los datos se actualizan sin ninguna intervención tuya, que todo el proceso es completamente transparente para ti, que es posible generar automáticamente analítica avanzada y sandboxes, que se crean nuevos datasets descubriendo de forma autónoma nuevas fuentes de datos y que es posible reutilizar datasets ya conocidos y probados.
Imagina, también, que se permite a los usuarios y las usuarias de negocio acceder a los datos de la empresa en autoconsumo y que los datasets están definidos en términos de negocio, fechas de caducidad de validez y de acceso.
Y, para finalizar y en relación con este último punto, imagina que la empresa tiene un control total sobre quién accede a cada dato y cuándo puede acceder, y todo ello cumpliendo al completo las políticas de confidencialidad, GDPR y demás aspectos legales.
Los datos más democráticos en las empresas
Bien, pues todo esto que parece un mundo ideal para cualquier profesional de analítica del dato, es ya una realidad. Existen soluciones que simplifican al máximo los procesos analíticos y que, adaptadas a los requerimientos concretos de cada organización, permiten sacar el máximo partido a la democratización del dato. Es responsabilidad de las empresas proveedoras de soluciones y servicios IT darlas a conocer para que las empresas pierdan el miedo a desplegar estrategias de análisis de datos ambiciosas porque estas son imprescindibles para potenciar su competitividad en un mercado cada vez más exigente.