AHORA NUESTROS CURSOS TAMBIÉN ONLINE
ALUMNOS
Contactar

Modelos predictivos para fidelizar clientes

22 de julio de 2019 15:00:37 CEST

A continuación presentamos uno de los proyectos destacados presentados por los alumnos de NEOLAND. La autora es Gemma Labraña, alumna del Data Science Bootcamp.

¿Es posible evitar la pérdida de clientes con Data Science?

Captar y fidelizar a los clientes es uno de los mayores retos al que se enfrentan las empresas. Retener clientes es prioritario en cualquier modelo de negocio, pero ¡no siempre es fácil!

Captar nuevos clientes tiene un coste muy elevado. Por ello, la mejor estrategia para evitar la pérdida de clientes es aquella que se centra en retenerlos

El primer paso para evitarlo es identificar las métricas que indican la probabilidad de que los clientes abandonen la compañía. Gracias a esta información, las empresas pueden implementar estrategias preventivas que eviten esta problemática.

El ratio de clientes perdidos nos permite conocer el coste que supone para el negocio. Para intentar reducir este coste, o incluso eliminarlo, una de las herramientas más útiles sería un modelo preventivo. 

¿Cuál es el objetivo de este proyecto?

Con este proyecto se pretende elaborar un modelo predictivo para minimizar el número de clientes perdidos. De este modo, es posible crear una herramienta que ayude a implementar estrategias y así evitar la pérdida de clientes. 

Extracción y limpieza de datos 

Para el desarrollo de este proyecto se utilizó la base de datos de KKBOX. Se trata de una plataforma de música en streaming que opera en Taiwan. Su modelo de negocio se basa en las suscripciones de sus clientes.

Los datos obtenidos arrojaban información sobre los suscriptores (datos personales), las transacciones (información financiera) y la recurrencia de uso de la plataforma.

Para poder convertir los datos obtenidos en información de valor fue necesario “limpiar” estos datos.

El 50% de los valores asociados a la edad y al género fueron considerados como erróneos y se descartaron. La variable que se priorizó por encima del resto fue la que aportaba información sobre el último pago realizado dentro de la plataforma. Esta información ayudó a conocer con mayor precisión los usuarios activos dentro de KKBOX.

Para filtrar la información de cada usuario se utilizó su ID dentro de la plataforma. La variable temporal que se estableció para acotar datos fue de tres meses. Teniendo esto en cuenta, se consideró un cliente perdido cuando no había ningún registro de actividad 30 días después de la fecha de vencimiento de la suscripción.

Modelo predictivo en Data Science

Modelado de los datos

Después de la limpieza de datos se utilizaron 31 características para entrenar un modelo XGBoost capaz de predecir la pérdida de clientes.

Este tipo de modelo está basado en árboles de decisión. Su funcionalidad es clasificar y pronosticar a través del aprendizaje automático.

 

La librería XGBoost implementada en Python se utilizó para crear un clasificador binario. A la hora de validar este modelo se empleó la validación cruzada y se hizo una prueba con muestreo estratificado.

Uno de los mayores retos a la hora de crear un modelo predictivo fueron los datos temporales y los conjuntos de datos desequilibrados. Esto supuso una limitación en el aprendizaje del modelo. 

Fig.3

Para conocer las tendencias de actividad de los usuarios en la plataforma se compararon varios periodos de tiempo. Se crearon características que midieron la información sobre las últimas 5 sesiones y la información sobre el total de sesiones.

Conclusiones

  • Mediante técnicas de machine learning con XGBoost se creó un modelo predictivo de clasificación capaz de conocer la rotación de clientes.
  • Las características más significativas utilizadas por este modelo fueron los datos sobre el registro de los usuarios.
  • Una vez conocida la probabilidad de rotación de los clientes, es posible desarrollar estrategias preventivas que ayuden a fidelizar.  

Suscríbete a nuestro email

Todavía no hay comentarios

Dinos que estás pensando