
El aprendizaje automático o Machine Learning es una de las ramas de la Inteligencia Artificial (IA) que, a grandes rasgos, tiene como objetivo desarrollar técnicas que permitan que las máquinas aprendan de manera automática. Hoy es una herramienta esencial para todos los sectores y no es para menos, ya que gracias al modelado de análisis predictivos por ejemplo, las empresas pueden llegar a alcanzar una personalización a sus clientes sin precedentes.
Para conocer un poco más en detalle esta rama, hemos recopilado algunos de los modelos, de menor a mayor uso de IA, con los que día a día trabajamos.
Segmentación de clientes
A la hora de analizar y entender mejor los patrones de comportamiento del usuario de una web o aplicación, existe el modelo de segmentación de clientes, el cual arroja datos con los que poder aplicar distintas acciones y así impactar a los usuarios que verdaderamente interesen.
Herramientas para entrenar el modelo
El primer paso para crear el modelo es contar con una base de datos que contenga los datos de las variables que se vayan a necesitar, como por ejemplo el gasto de dinero, la frecuencia de gasto, la recencia de compra (cuánto tiempo hace que el usuario no compra), etc.
Para poder crearlo, existen muchos modelos para poder hacerlo y las redes neuronales, por ejemplo, son una gran herramienta ya que permiten introducir muchísima cantidad de datos. Como este es proceso que va poco a poco, facilita que se puede trabajar con bases de datos de cientos de millones de filas las cuales acaban entendiendo muy bien el comportamiento del cliente, además de destacar qué variables son importantes y cuáles no.
Pongamos por ejemplo que queremos averiguar el gasto esperado y la probabilidad de que un usuario vuelva a comprar. Para poder trabajar sobre estas variables necesitamos una base de datos con todas las variables que la empresa pueda disponer del cliente, pero desplazada un año hacia atrás. Por otro lado, también hará falta otra base de datos con la información de si el cliente ha comprado o no en el último año y cuánto ha gastado. Con esta información, se podrá obtener un modelo el cual va a predecir si el cliente comprará o no al año siguiente. Y lo mismo con el gasto.
Con esta información ya sí se puede hacer diferentes tipos de segmentos. Por ejemplo, con los resultados que el modelo lanza con respecto a la probabilidad de gasto y de compra, se puede sacar primero el Customer Lifetime Value (CLV) del cliente para saber “cuánto vale” el cliente y las probabilidades de compra en la web o aplicación. También se puede llegar a predecir la fecha más probable de compra del cliente.
Resultados
- Maximizar el ROI.
- Minimizar costes.
Propensión en rebajas
Cuando se acercan los periodos de rebajas, ¿es posible predecir si un cliente va a comprar o no? Es posible.
Herramientas para entrenar el modelo
Para poder crear el modelo, es necesario contar con dos tipos de datasets. Por un lado, una base de datos que tenga recopilada toda la información del cliente de un tiempo mínimo de un año atrás al periodo de rebajas que queramos predecir. Por otro lado, también es importante tener acceso a la información que nos ayude a ver el comportamiento del usuario en los periodos de rebajas previas. Una vez recopilados los datos, llega el momento de construir el modelo con el que se entenderá el comportamiento de cada uno de los clientes para poder predecir la probabilidad de compra dentro de las fechas del periodo de rebajas.
Resultados
- Decidir a qué clientes impactar en periodos previos a rebajas.
- Estimar el número medio de compradores que habrá durante el periodo de rebajas.
- Conocer la evolución diaria de la probabilidad de compra una vez el periodo de rebajas ha comenzado.
Entity Resolution
El Entity Resolution es la tarea de encontrar registros en un conjunto de datos que se refieren a una misma entidad y que es uno de los mayores problemas que nos encontramos cuando trabajamos con una base de datos de clientes.
Pero para que se entienda un poco mejor, pongamos que por ejemplo tenemos una base de datos con la que se dispone de los Client_ID creados en base al correo electrónico de los usuarios. Al analizarla más detenidamente, observamos que es posible que un mismo cliente se ha podido dar de alta con dos emails diferentes, pero que el resto de la información es la misma. Es decir, se han generado dos Client_ID distintos de un mismo usuario. Teniendo en cuenta que lo que verdaderamente nos interesa es conocer el comportamiento del cliente, lo que hace el Entity Resolution es recopilar todos esos registros de un mismo usuario para poder así enlazar los diferentes perfiles que un mismo cliente haya podido generar a lo largo del tiempo.
Herramientas para entrenar el modelo
Para poder hacerlo, hay que partir de una base de datos que contenga toda la información que el usuario nos haya cedido. En este aspecto, aunque pudiéramos pensar que con crear un algoritmo que compare los registros valdría, es importante resaltar que existen datasets los cuales pueden contar con millones de filas, lo que conllevaría un coste computacional enorme. Por ello, existe la librería Zingg que directamente trabaja sobre este tipo de bases de datos ya que las estudia y resuelve el problema del duplicado aplicando algoritmos de Machine Learning. Al final, lo que se obtiene son Clusters_ID capaces de confirmar las cuentas que están creadas por un mismo cliente.
Resultados
- Obtener información más agrupada y fiable acerca de los clientes para conocer mejor su comportamiento.
- Bloquear cuentas fraudulentas.
- Mejorar significativamente todos los análisis realizados a partir de una BBDD de clientes unificados.
Sistemas de recomendación
Poder ofrecer productos personalizados a un cliente es más fácil gracias a la creación de los sistemas de recomendación a través de redes neuronales y aprendizaje automático. Gracias a estos sistemas, cuando un cliente entra en una web, es posible mostrarle en la parrilla (o enviarle a través de la newsletter) productos recomendados exclusivamente elegidos por su patrón de compra.
Herramientas para entrenar el modelo
La base de datos de clientes con la que se trabaje debe contar con los productos que han comprado en la última época. Al igual que con el resto de los modelos que hemos ido viendo, con los sistemas de recomendación también se puede incluir otro tipo de información adicional, como gasto, sesiones, dispositivos, etc.
Así, con toda esta información, la labor del algoritmo es estudiar y analizar qué productos han sido comprados por cada uno de los clientes para así recomendárselos a los grupos de clientes con un patrón de compra similar. Para llevar a cabo estos sistemas, una herramienta muy útil puede ser la biblioteca de código abierto desarrollada por Google, Tensor Flow. Esta librería nos permite elaborar unos modelos denominados AutoEncoders que analizan la información de los productos que ha comprado. En otras palabras, podemos cargar la información de los productos que ha comprado cada uno de los clientes y el modelo te devuelve la probabilidad de compra de ese cliente de dichos productos para así poder recomendarle únicamente los productos que tengan una mayor probabilidad de compra.
Resultados
- Aumentar la tasa de conversión gracias a la personalización.
- Mejorar la satisfacción del cliente.
- Entender qué productos/servicios están aportando realmente beneficios y cuáles habría que descartar.
Bonus - Computer vision
¿Se podría publicar una fotografía en redes sociales sabiendo con anterioridad el número de likes aproximado que podría alcanzar? Gracias a los modelos de Computer Vision, la técnica para adquirir, procesar, analizar y comprender imágenes del mundo real, estamos cada vez más cerca de que sea posible.
Herramientas para entrenar el modelo
Para la base de datos, lo ideal sería que tener el máximo de variables posible relacionadas con la publicación de las fotografías en redes sociales, como por ejemplo, número de likes, número de comentarios, la fecha cuando se subió, etc. Con toda esta información, se puede construir un modelo en Computer vision el cual va a analizar las imágenes e intentar predecir los me gustas. Para ello, el modelo lo que hace es interpretar la imagen en números: desde los colores, objetos, posiciones de modelos, la cara, el peinado, contraste, etc… Toda esta información es incluida y analizada en la red.
Aplicación
- Obtener la fotografía o post que maximiza la atracción de los usuarios.
- Implementar el modelo en cualquier red social.
Como podemos ver, existen muchas ventajas para poder hacer uso del aprendizaje automático, no solo para la mejora del contacto con el cliente sino también otro tipo de procesos dentro de las compañías. Eso sí, es importante tener en cuenta que, para hacer cualquier labor de predicción de esta magnitud, es primordial contar con una base de implementación sólida con la que se puedan obtener muchos datos para así trabajar por detrás, además de tiempo.