Cómo consolidar la analítica avanzada a través de un proceso continuo de afinamiento y validación

José Samaniego T.

(6 min)

Una vez realizado un análisis profundo con analítica descriptiva, el siguiente paso es utilizar este trabajo para hacer proyecciones y crear diferentes escenarios a través de analítica predictiva y prescriptiva. La primera de ellas nos permitirá anticipar posibles resultados, comportamientos y eventos, con el fin de mejorar un plan y responder de mejor forma. Mientras que la analítica predictiva es sobre futuros eventos, la prescriptiva es sobre encontrar el mejor curso de acción para una situación dada a través de técnicas de optimización.

Casos de uso de estos tipos de analítica son, por ejemplo, prevenir fallas de equipos (industria petrolera), detección de fraudes (Banca), deserción de clientes (Retail), predicción patrones climáticos (Agricultura), para nombrar algunos casos.

Este tipo de analítica tiene cierto grado de incertidumbre, que puede surgir tanto por la variabilidad de los datos como a través de errores sistemáticos y errores aleatorios.

Los errores sistemáticos ocurren por la imperfección en el proceso de flujo de datos (captura, integración, análisis, publicación), mientras que los errores aleatorios ocurren por razones desconocidas e impredecibles.

Es por esto que es necesario tratar de reducir el nivel de incertidumbre a través del afinamiento y validación continua, lo cual se podría llevar a cabo a través de las siguientes prácticas:

1. Validación Cruzada

La idea fundamental es esconder una parte de los datos para aprender del resto y entonces verificar la precisión del modelo creado utilizando los datos escondidos.

Se trata de una técnica estadística que divide los datos en subconjuntos: datos de entrenamiento y datos de prueba. El primer subconjunto permite crear el modelo de predicción, mientras que el segundo subconjunto permite evaluar el desempeño del modelo previamente creado.

Los conjuntos de datos son creados aleatoriamente, siendo el de entrenamiento más grande (80% de los datos) que el de prueba (20%).

Se pueden utilizar diferentes combinaciones de conjuntos de datos de pruebas para reducir la variabilidad del resultado como se observa en la gráfica a continuación:

2. Múltiples algoritmos

Mientras que la validación cruzada está enfocada con el afinamiento de los datos, la siguiente práctica está relacionada con el algoritmo utilizado para crear el modelo analítico (por ejemplo, regresión lineal).

El objetivo es probar con más de un solo algoritmo estadístico (p. ej. CART – Classification and Regression Trees, SVM – Support vector machines, etc.) con el fin de utilizar aquel que permite obtener un mejor resultado.

La selección de los algoritmos depende del tipo de problema planteado y de los tipos de datos.

3. Análisis de sensibilidad

La analítica predictiva busca predecir valores (variable dependiente) en función de ciertas variables independientes. A nivel empresarial, estas variables podrían ser tiempo, producto, inversión, material, etc. El objetivo de esta práctica es poder seleccionar las variables que tienen un mayor impacto en el modelo. Y esto se lo realiza en dos pasos:

  • Selección de variables: Utiliza técnicas de multicolinealidad para determinar la asociación existente entre las variables independientes y que afectan a la variable objetivo. Así como también técnicas que reduzcan un posible sobreajuste del modelo debido a una sobre exposición a los datos de entrenamiento.
  • Optimización de variables: Analiza a través de pruebas con diferentes valores en las variables de entrada cuál es el impacto que tienen estos cambios en el resultado de la variable resultante. A nivel empresarial, por ejemplo, se realizan estos análisis para calcular cuál sería el valor presente neto (VPN) más alto ajustando la tasa de WACC y la tasa de crecimiento.

BIBLIOGRAFIA

Le puede interesar

Novatech Power Brand 2021

Acerca de Grupo Novatech

Desde 1995, hemos realizado con éxito +1.000 proyectos de distinta índole a más de 600 empresas en Latinoamérica, ayudándolas a ser más eficientes y competitivas, aprovechando las posibilidades que ofrecen los avances tecnológicos. Conozca cómo le podemos ayudar.