Comprender el comportamiento de los clientes y personalizar los servicios que se ofrecen es uno de los usos más importantes de la ciencia de datos en los negocios. En un blog anterior de ixpantia conversamos sobre la importancia de la analítica avanzada en este tipo de empresas y mencionamos entre los casos significativos de uso las sugerencias y recomendaciones. En este artículo, vamos a conversar con más detalle sobre este tipo de sistemas.
Un sistema de recomendación es una herramienta que hace predicciones y sugerencias personalizadas sobre productos, servicios o contenido que permite identificar oportunidades de generación de valor para el cliente y maximizar la rentabilidad del negocio. Como consumidores, quizás el primer ejemplo que nos viene a la mente cuando mencionamos sistemas de recomendación es el tipo de sistemas que ofrecen plataformas como Amazon o Netflix. Estos sistemas usan la ciencia de datos para analizar nuestro historial de navegación y de compras para sugerir productos que probablemente nos interesen.
Pero los sistemas de recomendación van más allá de estos ejemplos y son una de las herramientas más usadas en empresas de consumo masivo para aumentar su competitividad y adaptarse rápidamente a los cambios de preferencias del consumidor. Las empresas de consumo masivo son las que se dedican a la producción, distribución y comercialización de productos que tienen una alta demanda y un ciclo de vida corto. Alimentos y bebidas, artículos de higiene personal y de limpieza del hogar son ejemplo de este tipo productos de consumo masivo que se compran con frecuencia y en grandes volúmenes.
Un sistema de recomendación puede ayudar a su empresa a resolver los siguientes problemas que muchos negocios enfrentan en sus operaciones:
En empresas de consumo masivo un sistema de recomendación es mucho más que un modelo de machine learning, por más sofisticado que sea ese modelo. El sistema está compuesto por varios componentes que actúan sinérgicamente como un todo. Por eso en ixpantia nos gusta referirnos a este tipo de sistemas como una solución de recomendación. Una solución de recomendación tiene por los menos los siguientes componentes:
La figura 1 muestra los componentes de esta solución y sus principales características:
Este es el primero de una serie de artículos sobre soluciones de recomendación. En este primer artículo vamos a referirnos a claves a considerar al desarrollar el componente de proyección de compra típica en una solución de recomendación.
En el componente de proyección de compra típica, buscamos predecir una lista de productos y volúmenes en el pedido regular del cliente. Es decir, buscamos llenar el carrito de compras de forma de que la experiencia de compra sea más eficiente.
Para lograr este objetivo, es necesario analizar los datos históricos de todos los clientes para identificar patrones y tendencias en el comportamiento regular de su compra. Con este análisis se desarrolla un modelo de estimación de proyección de compra típica que toma en cuenta factores como el tipo de producto, la segmentación del cliente y la frecuencia en la que realiza las órdenes.
Basados en nuestra experiencia desarrollando este tipo de soluciones, a continuación destacamos cuatro de los aspectos claves a considerar al iniciar un proyecto de esta naturaleza.
El objetivo principal del componente de proyección de compra típica es obtener la lista de productos y cantidades que un cliente pide habitualmente. Hay otros procesos de negocios relacionados pero que no deben confundirse con este. En particular, el objetivo del proyección de compra típica no es hacer una predicción de la demanda o de las ventas globales del negocio para planificación, un proceso que ocurre a otro nivel de granularidad y tiene objetivos de negocio muy diferentes. Tampoco es un instrumento para establecer metas de ventas.
El proceso de rellenado del carrito de compra tiene como ventajas:
Es importante tener en cuenta el tipo de datos con el que contamos para realizar estas estimaciones. Normalmente se asume que contamos con datos de pedidos de clientes, pero dependiendo de la forma de registrar los pedidos esto no siempre es posible. Es importante entonces tener clara la naturaleza del dato con el que estamos tratando: ¿Tenemos datos de pedidos o de entregas?. ¿Podemos contabilizar la diferencia entre el pedido y la entrega para un cliente dado? ¿Cómo se registran órdenes pendientes, pedidos cancelados y sustituciones?
Otro aspecto a considerar es el nivel de agregación de los datos que vamos a utilizar. Podemos considerar por lo menos estas dos dimensiones:
Si se tienen claras las características de los datos, es mucho más sencillo seleccionar el modelo apropiado y determinar las métricas con las que evaluamos los resultados.
Existen varias metodologías posibles para abordar los modelos de proyección de compra típica. Uno de los modelos de pronóstico más ampliamente usados son los modelos de series temporales. Estos modelos toman en cuenta el patrón histórico de los pedidos (su tendencia y estacionalidad) para extrapolar hacia el futuro. Sin embargo, si se usan estos modelos es importante verificar el impacto de estas dos supuestos:
Otra alternativa son los modelos de machine learning. Estos modelos pueden aprender relaciones complejas en los datos históricos e incorporar más fácilmente otros factores que pueden incidir en la predicción. El modelo se entrena para que aprenda a partir de transformaciones de los datos la relación entre estos y la respuesta deseada. Hay dos aspectos claves en el desarrollo de estos modelos:
Hay una gran variedad de modelos de machine learning, pero lo importante aquí no es el método o técnica específica (modelos basados en árboles, en redes neuronales, XGboost, entre otros) sino el enfoque analítico de aprender a través de los datos. En nuestra experiencia, muchas veces modelos heurísticos simples funcionan mejor que modelos más complejos, especialmente en situaciones donde no se dispone de un historial suficientemente largo de datos.
Tener métricas apropiadas nos permite obtener una realimentación valiosa y accionable sobre lo que podemos hacer para mejorar el modelo y los procesos de negocio que dependen de su predicción. Existe una gran variedad de métricas y seleccionar la apropiada para el caso en particular no es una tarea sencilla. Por ejemplo, algunas métricas dan demasiada importancia a valores extremos o poseen sesgos para algunos tipos de errores. Hay métricas absolutas y relativas y varias formas de definir el patrón bajo el cual se calculan las métricas relativas. A continuación citamos algunas de las métricas que en nuestra experiencia funcionan mejor, junto con sus características más relevantes:
Si se diseña apropiadamente el modelo de proyección de compra típica, se obtiene como resultado un sistema escalable y automatizado que se integra a los canales de venta de la empresa proporcionando recomendaciones en tiempo real y mejorando las decisiones comerciales.
Hay que destacar que este tipo de modelos de analítica complejos, no ocurren en un vacío. Para poder implementar exitosamente un modelo de este tipo se requiere como mínimo:
El esfuerzo en llevar a cabo este tipo de modelos merece la pena. Un estudio de la firma Mckinsey (2021), afirma que 71% de los consumidores esperan que las compañías les provean de servicios personalizados y las compañías de alto crecimiento obtienen 40% de sus ganancias de la personalización de sus servicios.
En el siguiente blogspot, discutiremos algunos de los aspectos más relevantes a considerar al implementar el segundo componente de un sistema de recomendación, el componente de proyección de compra innovadora y cómo se integra al sistema de recomendación.