Ciencia de datos para gestionar la canasta de productos en empresas de consumo masivo: Compra típica

Escrito por Magdiel Ablan | Sep 25, 2024 10:23:11 PM

Comprender el comportamiento de los clientes y personalizar los servicios que se ofrecen es uno de los usos más importantes de la ciencia de datos en los negocios. En un blog anterior de ixpantia conversamos sobre la importancia de la analítica avanzada en este tipo de empresas y mencionamos entre los casos significativos de uso las sugerencias y recomendaciones. En este artículo, vamos a conversar con más detalle sobre este tipo de sistemas.

Un sistema de recomendación es una herramienta que hace predicciones y sugerencias personalizadas sobre productos, servicios o contenido que permite identificar oportunidades de generación de valor para el cliente y maximizar la rentabilidad del negocio. Como consumidores, quizás el primer ejemplo que nos viene a la mente cuando mencionamos sistemas de recomendación es el tipo de sistemas que ofrecen plataformas como Amazon o Netflix. Estos sistemas usan la ciencia de datos para analizar nuestro historial de navegación y de compras para sugerir productos que probablemente nos interesen.

Pero los sistemas de recomendación van más allá de estos ejemplos y son una de las herramientas más usadas en empresas de consumo masivo para aumentar su competitividad y adaptarse rápidamente a los cambios de preferencias del consumidor. Las empresas de consumo masivo son las que se dedican a la producción, distribución y comercialización de productos que tienen una alta demanda y un ciclo de vida corto. Alimentos y bebidas, artículos de higiene personal y de limpieza del hogar son ejemplo de este tipo productos de consumo masivo que se compran con frecuencia y en grandes volúmenes.

Un sistema de recomendación puede ayudar a su empresa a resolver los siguientes problemas que muchos negocios enfrentan en sus operaciones:

Falta de personalización: Los clientes reciben recomendaciones genéricas que no reflejan sus preferencias ni patrones de compra individuales.
Pérdida de oportunidades de ventas cruzadas y adicionales: Sin recomendaciones precisas, la empresa no está maximizando el potencial de ventas de productos complementarios o relacionados.
Baja retención de clientes: La falta de recomendaciones relevantes disminuye la fidelización, ya que los clientes no perciben valor adicional en la oferta de productos.

En empresas de consumo masivo un sistema de recomendación es mucho más que un modelo de machine learning, por más sofisticado que sea ese modelo. El sistema está compuesto por varios componentes que actúan sinérgicamente como un todo. Por eso en ixpantia nos gusta referirnos a este tipo de sistemas como una solución de recomendación. Una solución de recomendación tiene por los menos los siguientes componentes:

Un componente de proyección de compra típica: la lista de artículos y cantidades que un cliente compra de forma regular.
Un componente de proyección de compra innovadora: la lista de artículos que el cliente no adquiere usualmente pero que basado en su historial de compra y en el historial de compra de clientes similares podrían interesarle.
Un componente de reglas de negocio: que combina los dos anteriores y proporciona una capa adicional de estrategia y personalización.

La figura 1 muestra los componentes de esta solución y sus principales características:

Figura 1: Componentes de una solución de recomendación.

Este es el primero de una serie de artículos sobre soluciones de recomendación. En este primer artículo vamos a referirnos a claves a considerar al desarrollar el componente de proyección de compra típica en una solución de recomendación.

Proyección de compra típica

En el componente de proyección de compra típica, buscamos predecir una lista de productos y volúmenes en el pedido regular del cliente. Es decir, buscamos llenar el carrito de compras de forma de que la experiencia de compra sea más eficiente.

Para lograr este objetivo, es necesario analizar los datos históricos de todos los clientes para identificar patrones y tendencias en el comportamiento regular de su compra. Con este análisis se desarrolla un modelo de estimación de proyección de compra típica que toma en cuenta factores como el tipo de producto, la segmentación del cliente y la frecuencia en la que realiza las órdenes.

Basados en nuestra experiencia desarrollando este tipo de soluciones, a continuación destacamos cuatro de los aspectos claves a considerar al iniciar un proyecto de esta naturaleza.

Definición de objetivos

El objetivo principal del componente de proyección de compra típica es obtener la lista de productos y cantidades que un cliente pide habitualmente. Hay otros procesos de negocios relacionados pero que no deben confundirse con este. En particular, el objetivo del proyección de compra típica no es hacer una predicción de la demanda o de las ventas globales del negocio para planificación, un proceso que ocurre a otro nivel de granularidad y tiene objetivos de negocio muy diferentes. Tampoco es un instrumento para establecer metas de ventas.

El proceso de rellenado del carrito de compra tiene como ventajas:

Optimizar el tiempo que se tarda o un vendedor o un cliente en hacer una orden.
Disminuir la probabilidad de olvido de un producto en la orden (con la consecuente demora en la atención y obtención del producto).
Mejorar la experiencia de compra y la satisfacción de los clientes con nuestra marca.

Tipo y naturaleza de los datos

Es importante tener en cuenta el tipo de datos con el que contamos para realizar estas estimaciones. Normalmente se asume que contamos con datos de pedidos de clientes, pero dependiendo de la forma de registrar los pedidos esto no siempre es posible. Es importante entonces tener clara la naturaleza del dato con el que estamos tratando: ¿Tenemos datos de pedidos o de entregas?. ¿Podemos contabilizar la diferencia entre el pedido y la entrega para un cliente dado? ¿Cómo se registran órdenes pendientes, pedidos cancelados y sustituciones?

Otro aspecto a considerar es el nivel de agregación de los datos que vamos a utilizar. Podemos considerar por lo menos estas dos dimensiones:

Materialidad: Es importante tener claro a qué nivel se van a realizar las predicciones. Por ejemplo, podría ser a nivel de SKU, de producto u otro orden de agregación. También es importante determinar cuáles son las unidades con las que vamos a trabajar. Podría ser a nivel de unidades, por empaques, por peso o volúmen equivalente, entre otros.
Temporalidad: Las predicciones pueden hacerse a nivel diario, semanal o mensual, dependiendo del proceso específico de ventas e inventario de los clientes en particular.
Horizonte temporal: Se refiere a si solo necesitamos las predicciones para un momento posterior en el tiempo o si requerimos predicciones para múltiples períodos en el futuro.

Si se tienen claras las características de los datos, es mucho más sencillo seleccionar el modelo apropiado y determinar las métricas con las que evaluamos los resultados.

Selección del enfoque de modelado

Existen varias metodologías posibles para abordar los modelos de proyección de compra típica. Uno de los modelos de pronóstico más ampliamente usados son los modelos de series temporales. Estos modelos toman en cuenta el patrón histórico de los pedidos (su tendencia y estacionalidad) para extrapolar hacia el futuro. Sin embargo, si se usan estos modelos es importante verificar el impacto de estas dos supuestos:

Los modelos de series temporales asumen que existe una periodicidad equidistante pero muchas veces el comportamiento de los pedidos no tiene esta regularidad. Esto hace que sea necesario imputar cuidadosamente los valores faltantes. Si la serie contiene muchos ceros, un método tradicional de series de tiempo puede no ser lo más indicado.
Para poder capturar un patrón estacional con un modelo de series temporales es necesario tener por lo menos de tres a cinco ciclos de datos. Por ejemplo, para capturar un patrón a nivel mensual es necesario contar con por lo menos cuatro años de datos. La pandemia global del COVID cambió el patrón de consumo a nivel global por lo que no es fácil contar actualmente con la cantidad continua de datos necesarios para capturar adecuadamente estacionalidad.
Un modelo de series temporales típicamente es un modelo univariante que no toma en cuenta otros factores internos y externos que influyen en la predicción del pedido. Factores externos como vacaciones o el clima e internos (como promociones, fallas de inventario o eventos) son difíciles de tomar en cuenta por el modelo.

Otra alternativa son los modelos de machine learning. Estos modelos pueden aprender relaciones complejas en los datos históricos e incorporar más fácilmente otros factores que pueden incidir en la predicción. El modelo se entrena para que aprenda a partir de transformaciones de los datos la relación entre estos y la respuesta deseada. Hay dos aspectos claves en el desarrollo de estos modelos:

Los datos y variables que el modelo usa en la predicción: Además de pericia técnica, se requiere del entendimiento y las intuiciones del negocio sobre los aspectos y variables a capturar que ellos entienden como clave en el proceso.
La calibración o tuneo de los parámetros del modelo: Esta parte requiere un esfuerzo importante de experimentación científica y la habilidad de establecer algoritmos de cálculo de forma eficiente. Es un proceso iterativo que puede consumir una cantidad de tiempo importante del proyecto.

Hay una gran variedad de modelos de machine learning, pero lo importante aquí no es el método o técnica específica (modelos basados en árboles, en redes neuronales, XGboost, entre otros) sino el enfoque analítico de aprender a través de los datos. En nuestra experiencia, muchas veces modelos heurísticos simples funcionan mejor que modelos más complejos, especialmente en situaciones donde no se dispone de un historial suficientemente largo de datos.

Métricas para la evaluación del modelo

Tener métricas apropiadas nos permite obtener una realimentación valiosa y accionable sobre lo que podemos hacer para mejorar el modelo y los procesos de negocio que dependen de su predicción. Existe una gran variedad de métricas y seleccionar la apropiada para el caso en particular no es una tarea sencilla. Por ejemplo, algunas métricas dan demasiada importancia a valores extremos o poseen sesgos para algunos tipos de errores. Hay métricas absolutas y relativas y varias formas de definir el patrón bajo el cual se calculan las métricas relativas. A continuación citamos algunas de las métricas que en nuestra experiencia funcionan mejor, junto con sus características más relevantes:

Bray-Curtis: indica similitud entre los pedidos reales y los pedidos pronosticados tanto en variedad (cuales productos forman parte del pedido) y volumen (la cantidad de los productos). Es una métrica que tiene su orígen en ecología, pero que tiene cada vez más aplicaciones en aprendizaje automático. Toma valores entre 0 (pedidos y pronósticos completamente diferentes) y 1 (pedido y pronóstico se corresponden exactamente). Tiene como desventaja que no es una métrica de aplicación extendida en esta área y por eso sus valores pueden ser difíciles de interpretar.
WAPE (Weighted Absolute Percentage Error): Es una forma de medir el error en la estimación que se calcula como la suma del error absoluto entre el valor pronosticado y el valor pedido real normalizado por la cantidad pedido expresado como un porcentaje. Es una métrica ampliamente utilizada en modelos de series temporales y es sencilla de interpretar. Una desventaja es que no funciona bien cuando los pedidos tienen un comportamiento esporádico y es muy sensible a valores extremos.
RMSE (Root Mean Squared Error): Es otra de las formas de medir errores en la estimación. A diferencia del WAPE, los resultados se expresan en las mismas unidades que la estimación. Es decir, podemos decir que si un RMSE es de 2.1, la estimación en promedio tiene un error de 2.1 productos. Entre sus desventajas está que es difícil comparar su valor entre conjuntos de datos con diferentes escalas y es incluso más sensible que el WAPE a valores extremos.
MASE (Mean Absolute Scaled Error) es el error promedio absoluto escalado. Es un error relativo que mide el error de pronóstico con respecto a un pronóstico base. Representa cuántas veces mejor o peor es la estimación comparada con el pronóstico más simple. Es una estimación robusta a valores extremos. Se recomienda especialmente en caso de pedidos que no son completamente regulares y frecuentes.

Conclusiones

Si se diseña apropiadamente el modelo de proyección de compra típica, se obtiene como resultado un sistema escalable y automatizado que se integra a los canales de venta de la empresa proporcionando recomendaciones en tiempo real y mejorando las decisiones comerciales.

Hay que destacar que este tipo de modelos de analítica complejos, no ocurren en un vacío. Para poder implementar exitosamente un modelo de este tipo se requiere como mínimo:

Una buena calidad de los datos: Se obtiene generalmente como producto de políticas y procesos robustos de gobernanza y gestión. En este artículo del blog de ixpantia, presentamos algunas de las buenas prácticas que podemos implementar en nuestra organización para lograrlo.
Un modelo claro de arquitectura e integración: Para desplegar las recomendaciones con los procesos y herramientas correctos, idealmente con omnicanalidad.
Sólidas capacidades en ciencia e ingeniería de datos en el equipo para comprender, utilizar e implementar el modelo con todas sus implicaciones y potencial.

El esfuerzo en llevar a cabo este tipo de modelos merece la pena. Un estudio de la firma Mckinsey (2021), afirma que 71% de los consumidores esperan que las compañías les provean de servicios personalizados y las compañías de alto crecimiento obtienen 40% de sus ganancias de la personalización de sus servicios.

En el siguiente blogspot, discutiremos algunos de los aspectos más relevantes a considerar al implementar el segundo componente de un sistema de recomendación, el componente de proyección de compra innovadora y cómo se integra al sistema de recomendación.

Referencias

Hyndman Rob J. y Anne B. Koehler. 2006. Another look at measures of forecast accuracy. International Journal of Forecasting 22. pg. 679 – 688
Arora Nidhi, Daniel Ensslen, Lars Fieder, Wei Wei Liu, Kelsey Robinson, Eli Stein y Gustavo Schüler, 2021. El valor de entender bien o mal la personalizacion se multiplica. https://www.mckinsey.com/featured-insights/destacados/el-valor-de-entender-bien-o-mal-la-personalizacion-se-multiplica/es
Vandeput, Nicolas. 2023. Demand Forecasting Best Practices. Manning.

Ver post completo