
En la primera entrega que le dedicamos a los modelos de atribución, explicamos en detalle cuáles son los modelos que desde Google Analytics 4 nos ofrecen y los retos que presentan. En esta segunda entrega vamos a ir un poco más allá para mostrar que también se pueden crear modelos de atribución con los datos en bruto a través de modelos estadísticos.
Al igual que con GA4, gracias a modelos estadísticos como las cadenas de Markov, por ejemplo, podemos obtener la información del valor de cada uno de los canales de contacto con los que interactúa un usuario en su customer journey y así atribuir las conversiones de una manera más acertada. Pero, ¿cómo podemos conseguirlo? A continuación, analizamos algunos de ellos.
Modelos Data Driven
Como ya comentamos en el anterior post, dentro de los modelos de atribución multicanal encontramos dos: los modelos basados en reglas, los cuales se caracterizan por ser heurísticos y partir de reglas definidas a priori, como el último clic o primer clic; y por otro lado los modelos de atribución basados en datos o modelos Data Driven. Gracias a estos modelos se pueden reorientar los recursos ya que ayudan a distribuir el valor de la conversión comprendiendo cómo interactúan los canales entre sí dentro del customer journey del usuario. Dentro de ellos, al tomar conceptos de la estadística clásica para aplicarlo a problemas, se pueden usar para realizar atribución como las cadenas de Markov, un modelo probabilístico que describe los procesos en los que las variables están sujetas a sucesos aleatorios ya que asume que la probabilidad de que ocurra un evento futuro depende sólo del estado actual del sistema, y no de la historia pasada.
Si traducimos esto en el ámbito de modelos de atribución, Markov se utiliza para modelar el camino que sigue el usuario a través de la relación entre los diferentes canales antes de realizar la conversión. Con ello, lo que se busca es considerar todos los pasos posibles que pueda seguir un usuario en su customer journey, calculando y asignando las probabilidades de “qué pasaría si” este canal no existiese. Es decir, si es importante un canal frente a otro o se puede prescindir de él. Y así, con el objetivo de querer responder a esta pregunta, es cómo se determinan los pesos de atribución.
Modelos de contribución o Marketing Mix Modelling
Estos modelos se usan para analizar y cuantificar el impacto de los recursos de marketing tomando como base la inversión realizada en cada uno de los canales publicitarios para relacionarlo con las ventas. La información que ofrece este tipo de modelo es muy interesante, como por ejemplo conocer el nivel de inversión que se puede realizar en cada canal, hacer una estimación de las ventas futuras, optimizar el reparto de presupuestos entre los canales de contacto e incluso incorporar factores externos, como un contexto económico específico o fechas especiales, para ver el impacto en las ventas.
Como se puede ver, aunque ambos modelos son usados para analizar y entender el impacto que cada canal, entre ellos existen diferencias. Los modelos Mix Modelling, por ejemplo, tienen su foco de atención en la inversión, por lo que ofrecen información de cuánto invertir en cada canal, pero no de cómo hacerlo. Por otro lado, utilizan datos históricos para identificar patrones y tendencias en el comportamiento del consumidor y el rendimiento del marketing, por lo que requieren de una gran cantidad de información que no siempre se pueden recolectar. Además, precisan de análisis más profundos y ad-hoc para acomodarse bien a toda la información que necesitan.
Por su lado, los modelos Data Driven están centrados más en las conversiones que en la inversión. Usan los datos a nivel de usuario recopilados en tiempo real y se puede incluir un mayor número de canales. Otro punto de diferencia es que estos modelos hacen uso del aprendizaje automático para analizar los datos y proporcionar así información detallada, por lo que son capaces de capturar patrones de comportamiento más complejos. Esto conlleva a que su metodología es menos sencilla de explicar que lo modelos Mix Modelling.
Ahora que sabemos un poco más sobre estos modelos de atribución, vamos a ver un caso de uso de la construcción de un modelo de atribución con modelos estadísticos.
Caso de uso con un modelo de atribución data driven
Una empresa del sector retail quiere conocer cómo contribuye cada uno de los canales con los que interactúan sus usuarios (Instagram, newsletter, Google Ads, Facebook Ads, orgánico, etc), y optimizar su estrategia de marketing para mejorar tanto el retorno de la inversión (ROI) como el retorno de la inversión publicitaria (ROAS).
Objetivo
Identificar qué canales con los que interactúa el usuario están contribuyendo de manera efectiva en las conversiones.
Solución
Creación de un modelo de atribución basado en datos con el que poder optimizar la inversión en los canales de marketing y optimizar la estrategia.
El proceso
De cara a la preparación de los datos, partimos de los datos recopilados del customer journey de los últimos 90 días de los usuarios desde el primer contacto hasta la conversión. Para ello, tuvimos en cuenta algunas consideraciones:
- Lo que no convirtieron, los desechamos.
- Establecer una ventana temporal de 30 días como máximo entre la comunicación de los canales.
Primer paso: Preparación de los datos. Usamos el dato en bruto de GA4 almacenado en BigQuery del periodo recogido y lo hicimos a través de unas transformaciones en SQL. Los resultados se extrajeron a una tabla modelo.
Segundo paso: Construcción de los modelos. Con la tabla modelo, la manipulamos con librerías de Python para construir las reglas basadas en los modelos basados en reglas y Data Driven, es decir: último clic, primer clic, lineal, según la posición, declive en el tiempo y cadenas de Markov. Con estos resultados creamos una nueva tabla de atribución que volverá a tener un proceso con SQL.
Tercer paso: Resultados. Con toda esta información, creamos una tercera tabla en donde se obtiene el cálculo del peso que cada uno de los canales con los que ha interactuado el usuario tiene por cada modelo de atribución calculado. De esta manera, a medida que vayan pasando los días, se podrá ver cómo va cambiando la atribución diariamente con respecto a los últimos 90 días anteriores.
Gracias a la obtención de los resultados de los pesos de los diferentes modelos de atribución, se puede obtener una perspectiva completa de cómo se están asignando las conversiones en los diferentes canales. Por ejemplo, empresas que tengan un gran presupuesto en marketing y publicidad les interesará un modelo basado en datos, pero empresas con un proceso de conversión más corto y directo, estarán más interesadas en modelos de atribución de último clic. En nuestro caso, y tras analizar las casuísticas y necesidades de la compañía, nos decantamos por continuar con los resultados que ofrecen las cadenas de Markov.
Como se puede ver, aunque los modelos de atribución son herramientas limitadas tanto en su precisión como eficacia, su uso es de gran utilidad de cara a entender si la estrategia de marketing y publicidad establecida está afectando o no a las conversiones e inversiones. Por último, no debemos olvidar que para que un modelo de atribución tenga más o menos efectividad, depende también de los datos de los que se disponga. Cuando más completos y precisos, mejor.