AHORA NUESTROS CURSOS TAMBIÉN ONLINE
ONLINE
Contactar
Menu
ALUMNOS
Contactar

Cómo evitar los precios erróneos en los marketplaces

19 de julio de 2019 13:40:33 CEST

A continuación presentamos uno de los proyectos destacados presentados por los alumnos de NEOLAND. La autor es Nicholas Rigo, alumno del Data Science Bootcamp.

¿Es posible evitar la fijación errónea de los precios en la venta online? 

Uno de los problemas a los que se enfrentan las empresas de compra venta online es la pérdida de ingresos debido a la fijación errónea de los precios.Un análisis previo al establecimiento de los precios es esencial en todos los sectores.

Este proyecto se centra en la resolución de esta problemática en Mercari, una web orientada a la compra-venta de artículos de segunda mano.

Descifrando el problema

Uno de los grandes problemas a los que se enfrenta Mercari es la pérdida de ingresos debido a una fijación de los precios errónea. El modelo de negocio de esta web consiste en cobrar una comisión de un 10% sobre cada una de las ventas que se realiza a través de su portal. Por lo tanto, si uno de los vendedores fija un precio inferior al que el producto tiene en el mercado, la comisión que ingresa Mercari es menor a la que le correspondería. En el caso contrario, si el precio fijado para uno de los productos es mayor, es posible que el producto no se venda. Por lo tanto se reducen las oportunidades de venta en esta plataforma.

¿Cómo evitar una fijación de precios errónea? 

Para solucionar este problema se creó un algoritmo predictivo. El objetivo es que fuera capaz de sugerir el precio adecuado de cada producto basándose en su precio real en el mercado.

La implementación de este algoritmo ayuda a definir estrategias de negocio y posicionamiento frente a la competencia.

Para la creación de este algoritmo se utilizó un modelo RandomForest basado en los datos extraídos de Mercari.

Fases del proyecto

Para desarrollar este proyecto se siguieron las fases que se muestran a continuación:

Análisis de datos 

La primera fase consistió en el análisis de la base de datos extraída de Mercari. Se creó una tabla con las siete características que se muestran a continuación: 

  • Título del producto
  • Marca
  • Categoría
  • Condición
  • Costes de envío
  • Descripción del producto
  • Precio de venta

análisis de datos en data science

Completar información en las fichas de producto

El siguiente paso fue completar la información de cada una de las fichas de los productos. Cuanta más información incluya cada ficha, más fácil será categorizar los productos para fijar sus precios. En este caso se hizo especial hincapié en los productos que no incluían la marca en su ficha.

Se creó una lista de todas las marcas y se revisó en el título de cada producto. Si contenía el nombre de la marca, el algoritmo autocompletaba esta información de forma a utomática en la ficha del producto. 

Análisis de datos

La fase de análisis consistió en extraer las palabras más significativas de cada descripción. El algoritmo las analiza y en base a ello establece el precio de  cada producto.

Por ejemplo, pensemos en la categoría 'anillos'. Si en la descripción aparece la palabra 'diamante', ese producto tendrá un precio más caro que otro con la palabra 'plata'.

Para llegar a la raÍz de las palabras se siguieron los siguientes pasos:

análisis de datos en data science

En la siguiente imagen se puede ver un ejemplo de una descripción en bruto de un producto y su comparación con una descripción una vez analizada.

análisis de palabras optimizadas

¿Cómo funciona el algoritmo RandomForest?

Para predecir los precios se ha utilizado un algoritmo denominado RandomForest que basa su principio en los árboles de decisión.

árbol de decisión data science

Hay que tener en cuenta que un árbol de decisión por sí solo no sirve para predecir con exactitud. Por ello, este modelo RandomForest plantea la creación de muchos árboles diferentes. Todos ellos fueron creados a partir de datos aleatorios. Por ejemplo, el árbol que se observa en la imagen anterior empieza separando los datos dependiendo de si un objeto es de marca o no. Le sigue la categoría del producto y finalmente, uniendo la marca y el tipo de producto establece el precio que tiene en el mercado. 

El siguiente árbol que creó el algoritmo no utilizó la marca para predecir el precio. Comenzó separando información para identificar cada una de las palabras y poder categorizarlas. 

El tercer árbol creado no contempló la información acerca de la categoría del producto. Siguiendo este mismo procedimiento, lo ideal es crear el mayor número posible de árboles que, poco a poco, extraigan la mayor cantidad de información posible de cada una de las fichas de los productos.

Al final ,con esta técnica se consigue que el algoritmo aprenda qué es lo más importante para calcular el precio de cada producto. Gracias a esta técnica de árboles aleatorios se consigue una predicción más precisa.

Por ejemplo, si los productos analizados son joyas, lo ideal es analizar las palabras que definan el material con el que están hechas. En caso de que los productos analizados sean prendas de vestir, la marca es uno de los puntos clave para analizar. 

Conclusiones

El objetivo de este proyecto era lograr que, a través de un algoritmo de predicción, fuera posible fijar el precio correcto de los productos ofertados en las webs de compra venta online.

En la siguiente imagen se pueden ver los resultados extraídos gracias al algoritmo de predicción de precios.

Se observa que, conforme aumenta el precio disminuye la precisión. Esto se debe a marketplaces como Mercari cuentan con menos referencias de productos considerados de lujo. 

Figura 5

También te puede interesar

Estos post sobre Data Science

Suscríbete a nuestro email

Todavía no hay comentarios

Dinos que estás pensando