Para asegurar la calidad de un proyecto de ciencia de datos, las empresas necesitan el ownership de los datos que generan.
Las estrategias de ciencias de datos están ganando cada vez más terreno entre las empresas españolas: un reciente informe señala que el 96% de los decisores empresariales afirma estar seguro que la forma en la que se maneja y gestiona los datos ha tenido un impacto positivo en el desempeño de sus organizaciones. Por otra parte, un 64% admitió haber obtenido niveles más altos de resiliencia con la presencia de una estrategia de datos madura.
Los datos son en sí mismos el insumo vital que retroalimenta todo este proceso, por lo que exigen una mirada profunda y atenta de parte del negocio. Frente al diseño de una estrategia de este tipo una consulta fundamental es: ¿Cuánto historial de los clientes tengo guardado? ¿Quién es el dueño de los datos?
En esta instancia es central lo que yo llamo la “política del dato”, esto es: las empresas necesitan ser dueñas de sus datos y asegurar la calidad de los mismos. En la gran mayoría de los casos, esa calidad es directamente proporcional a la calidad de las aplicaciones o sistemas en los que se crean los datos.
La segunda cuestión es que lo importante no es el tamaño. Podemos hablar de “small data” (encuestas, experimentos, datos de las empresas, datos sistemáticos y estructurados) o “big data” (datos espontáneos, no estructurados y generados a gran velocidad desde múltiples fuentes) pero lo importante es lograr una manera de sistematizar su explotación para el negocio.
Cuando una empresa logra un dominio sobre sus datos y adopta un enfoque “data-driven” significa que toma decisiones estratégicas basadas en análisis de datos e interpretación y así, logra atender mejor a sus clientes y consumidores. Sin embargo, en primera instancia una cultura de este tipo debe tener el ownership de esos datos.
Si tiempo atrás el “Management de los datos” era sólo concebible en el caso de empresas multinacionales, grandes corporaciones o instituciones, hoy la situación ha cambiado notablemente.
Refuerzo este último porque muchas veces sucede que si se está recién comenzando con la estrategia de ciencia datos y se quiere obtener información por ejemplo de cómo los consumidores utilizan cierto producto o bien saber dónde las personas abandonan el embudo de conversión o cuál es la tasa de retención general, los reportes provenientes de herramientas de análisis generales básicas disponibles en el mercado pueden parecer una buena opción.
Sin embargo, nada se compara con el enorme valor de poder realizar cualquier análisis del negocio sin tener que depender de plataformas o aplicaciones de terceros. Lo que esto requiere es que la compañía posea y administre su propia base de datos como una decisión estratégica.
Esta madurez generalmente llega cuando las preguntas empiezan a tener mayor profundidad. Si las preguntas que se intentan responder con los datos se hacen más específicas, las herramientas de analítica más comunes suelen hacer agua.
Adicionalmente, si una empresa no ha establecido una política básica de gobierno de datos, a menudo es un problema para todas las áreas que requieren una mirada atenta de esos datos, no sólo de proveedores de sistemas y aplicaciones.
En definitiva, la administración de los propios datos brinda una opción más flexible para responder a todas las necesidades presentes y futuras del negocio. Integración de datos, calidad, gestión y gobierno son todas dimensiones que definitivamente deben ir unidas para lograr un proyecto de ciencia de datos exitoso.
Julio Cesar Blanco – 11 de julio del 2022