El ABC de un proceso de Ciencia de Datos

Posted by Julio Cesar Blanco at 22 Mar 2022

“Los datos, el corazón de una estrategia de Transformación Digital”

La irrupción de la pandemia del COVID-19 impactó fuertemente en la economía española, llevándola a una marcada caída en la actividad, sobre todo a aquellos sectores más afectados por los aislamientos y la reducción en la movilidad.

Particularmente, el tejido productivo español está dominado por las pymes, las que además, por su propia naturaleza, alcanzan un grado de digitalización menor que las grandes empresas. Este escenario, hizo que estuvieran en clara desventaja en un contexto donde el mayor grado de penetración digital era clave para la competitividad.

La necesidad de una transformación digital es rápida y profunda. El Plan de Impulso a la Digitalización de Pymes 2021-2025 implica un conjunto de iniciativas públicas que apuntan a impulsar la adopción de las nuevas tecnologías y la digitalización de las empresas. Este proyecto está en línea con el  Plan de recuperación, transformación y resiliencia que prevé que en los próximos tres años, España recibirá 140.000 millones de euros por parte de la Unión Europea dentro del paquete de estímulos Next Generation EU. De acuerdo con la previsión, alrededor del 30% de los fondos estarán destinados a la transformación digital.

La oportunidad para impulsar y consolidar la gran promesa de la digitalización es única. Sin embargo, la transformación digital está en la agenda como un aspiracional que requiere de un anclaje concreto: ¿Cómo arrancar? ¿Cómo encarar un proceso de esta naturaleza?

Para empezar, quisiera hablar de “datos”, que son el corazón de una transformación de este tipo. Más específicamente quisiera referirme a proyectos de “Ciencia de Datos” porque se acercan aún más al objetivo del negocio. Esto es así porque encarar un proceso de Ciencia de Datos implica gestionar los datos de manera de poder tomar decisiones dinámicas que beneficien a los negocios. Entra a tallar un campo interdisciplinario que involucra métodos científicos, procesos y sistemas que extraen conocimiento de los datos con el objetivo de analizar la actualidad, predecir el futuro y tomar las decisiones de negocio más oportunas.

Todo proyecto de ciencia de datos sigue un proceso que podemos resumir en 6 pasos:

  1. Definición de un problema: Traducir el problema de negocios e identificar fuente de datos. Debemos tener muy claro el problema que queremos resolver, por lo que toca preguntarse: ¿Cuál es mi objetivo principal? ¿Qué problema de negocios tengo? ¿Qué quiero explicar utilizando datos?
  1. Preparación de los datos: Seleccionar datos útiles y extraerlos de sus fuentes.  Aquí cabe una cuestión central: ¿Cuánto historial de los clientes tengo guardado? ¿Quién es el dueño de los datos?
  1. Estudio de los datos: Limpieza y transformación. Analizar las variables para entender su comportamiento y relación. Una cultura orientada al dato requiere de una toma de decisiones sistemática a partir de un “culto al dato”. Es de vital importancia contar con equipo orientado a tal fin.
  1. Creación del modelo: Crear el modelo y entrenarlo. Una vez construido el modelo, es posible predecir la realidad a partir de cualquier información disponible. Machine Learning es la gran revolución para estos procesos: el uso de algoritmos informáticos permite que los modelos aprendan automáticamente a través de la experiencia.
  1. Validación y pruebas: Ajustar los parámetros y evaluar el modelo a través de prueba y error..
  1. Visualización: Mostrar los datos utilizando las herramientas visuales adecuadas.

Sin duda, no existe mejor momento para impulsar un proceso de ciencia de datos que éste.

El proceso descrito es solamente un primer acercamiento a un proceso que implica inversión de tiempo y dedicación para entender sus pasos e implicancias.

Dejaré para próximas entregas el desafío de ir deteniéndonos en cada una de estas fases, profundizando sus alcances y sus demandas.

Por lo pronto, es importante tener en claro el núcleo de este tipo de proyectos. el mayor reto no reside en obtener datos sino en cómo extraer sentido de ellos. Un equipo a la altura y un análisis sistematizado son la clave para que este proceso permita al negocio lograr las mejores decisiones y alcanzar mayores y mejores niveles de competitividad.

Leave a Reply

Your email address will not be published. Required fields are marked *