AHORA NUESTROS CURSOS TAMBI脡N ONLINE
ALUMNOS
Contactar

C贸mo evitar los precios err贸neos en los marketplaces

19 de julio de 2019 13:40:33 CEST

A continuaci贸n presentamos uno de los proyectos destacados presentados por los alumnos de NEOLAND. La autor es Nicholas Rigo, alumno del Data Science Bootcamp.

驴Es posible evitar la fijaci贸n err贸nea de los precios en la venta online? 

Uno de los problemas a los que se enfrentan las empresas de compra venta online es la p茅rdida de ingresos debido a la fijaci贸n err贸nea de los precios.Un an谩lisis previo al establecimiento de los precios es esencial en todos los sectores.

Este proyecto se centra en la resoluci贸n de esta problem谩tica en Mercari, una web orientada a la compra-venta de art铆culos de segunda mano.

Descifrando el problema

Uno de los grandes problemas a los que se enfrenta Mercari es la p茅rdida de ingresos debido a una fijaci贸n de los precios err贸nea. El modelo de negocio de esta web consiste en cobrar una comisi贸n de un 10% sobre cada una de las ventas que se realiza a trav茅s de su portal. Por lo tanto, si uno de los vendedores fija un precio inferior al que el producto tiene en el mercado, la comisi贸n que ingresa Mercari es menor a la que le corresponder铆a. En el caso contrario, si el precio fijado para uno de los productos es mayor, es posible que el producto no se venda. Por lo tanto se reducen las oportunidades de venta en esta plataforma.

驴C贸mo evitar una fijaci贸n de precios err贸nea? 

Para solucionar este problema se cre贸 un algoritmo predictivo. El objetivo es que fuera capaz de sugerir el precio adecuado de cada producto bas谩ndose en su precio real en el mercado.

La implementaci贸n de este algoritmo ayuda a definir estrategias de negocio y posicionamiento frente a la competencia.

Para la creaci贸n de este algoritmo se utiliz贸 un modelo RandomForest basado en los datos extra铆dos de Mercari.

Fases del proyecto

Para desarrollar este proyecto se siguieron las fases que se muestran a continuaci贸n:

An谩lisis de datos 

La primera fase consisti贸 en el an谩lisis de la base de datos extra铆da de Mercari. Se cre贸 una tabla con las siete caracter铆sticas que se muestran a continuaci贸n: 

  • T铆tulo del producto
  • Marca
  • Categor铆a
  • Condici贸n
  • Costes de env铆o
  • Descripci贸n del producto
  • Precio de venta

an谩lisis de datos en data science

Completar informaci贸n en las fichas de producto

El siguiente paso fue completar la informaci贸n de cada una de las fichas de los productos. Cuanta m谩s informaci贸n incluya cada ficha, m谩s f谩cil ser谩 categorizar los productos para fijar sus precios. En este caso se hizo especial hincapi茅 en los productos que no inclu铆an la marca en su ficha.

Se cre贸 una lista de todas las marcas y se revis贸 en el t铆tulo de cada producto. Si conten铆a el nombre de la marca, el algoritmo autocompletaba esta informaci贸n de forma a utom谩tica en la ficha del producto. 

An谩lisis de datos

La fase de an谩lisis consisti贸 en extraer las palabras m谩s significativas de cada descripci贸n. El algoritmo las analiza y en base a ello establece el precio de  cada producto.

Por ejemplo, pensemos en la categor铆a 'anillos'. Si en la descripci贸n aparece la palabra 'diamante', ese producto tendr谩 un precio m谩s caro que otro con la palabra 'plata'.

Para llegar a la ra脥z de las palabras se siguieron los siguientes pasos:

an谩lisis de datos en data science

En la siguiente imagen se puede ver un ejemplo de una descripci贸n en bruto de un producto y su comparaci贸n con una descripci贸n una vez analizada.

an谩lisis de palabras optimizadas

驴C贸mo funciona el algoritmo RandomForest?

Para predecir los precios se ha utilizado un algoritmo denominado RandomForest que basa su principio en los 谩rboles de decisi贸n.

谩rbol de decisi贸n data science

Hay que tener en cuenta que un 谩rbol de decisi贸n por s铆 solo no sirve para predecir con exactitud. Por ello, este modelo RandomForest plantea la creaci贸n de muchos 谩rboles diferentes. Todos ellos fueron creados a partir de datos aleatorios. Por ejemplo, el 谩rbol que se observa en la imagen anterior empieza separando los datos dependiendo de si un objeto es de marca o no. Le sigue la categor铆a del producto y finalmente, uniendo la marca y el tipo de producto establece el precio que tiene en el mercado. 

El siguiente 谩rbol que cre贸 el algoritmo no utiliz贸 la marca para predecir el precio. Comenz贸 separando informaci贸n para identificar cada una de las palabras y poder categorizarlas. 

El tercer 谩rbol creado no contempl贸 la informaci贸n acerca de la categor铆a del producto. Siguiendo este mismo procedimiento, lo ideal es crear el mayor n煤mero posible de 谩rboles que, poco a poco, extraigan la mayor cantidad de informaci贸n posible de cada una de las fichas de los productos.

Al final ,con esta t茅cnica se consigue que el algoritmo aprenda qu茅 es lo m谩s importante para calcular el precio de cada producto. Gracias a esta t茅cnica de 谩rboles aleatorios se consigue una predicci贸n m谩s precisa.

Por ejemplo, si los productos analizados son joyas, lo ideal es analizar las palabras que definan el material con el que est谩n hechas. En caso de que los productos analizados sean prendas de vestir, la marca es uno de los puntos clave para analizar. 

Conclusiones

El objetivo de este proyecto era lograr que, a trav茅s de un algoritmo de predicci贸n, fuera posible fijar el precio correcto de los productos ofertados en las webs de compra venta online.

En la siguiente imagen se pueden ver los resultados extra铆dos gracias al algoritmo de predicci贸n de precios.

Se observa que, conforme aumenta el precio disminuye la precisi贸n. Esto se debe a marketplaces como Mercari cuentan con menos referencias de productos considerados de lujo. 

Figura 5

Suscr铆bete a nuestro email

Todav铆a no hay comentarios

Dinos que est谩s pensando