Cas d’usage #2 : Identifying GA3 VS GA4 data discrepancies

Category: Performance | Solution: DataMa Compare, Datama Pivot | Type : Ad hoc | Client: Web travel | Extension: None Tags: #Occupation #Stock #Conversion

Contexte

Le client est un acteur majeur de l’hôtellerie en France. Avec le passage prochain de GA3 (Universal Analytics) à GA4, l’équipe data analytics a commencé à migrer ses rapports Web vers GA4. Au cours du processus, ils ont remarqué des écarts dans leurs principaux indicateurs de performance clés, tels que les sessions, les transactions et les revenus. Cependant, ils avaient besoin d’un moyen d’identifier systématiquement toutes ces différences entre les deux versions pour voir s’il y avait des dimensions qui étaient à l’origine de ces écarts. En d’autres termes, ils avaient besoin d’un moyen rapide de voir les différences entre GA3 et GA4 et les causes possibles de ces écarts.

Approche

Équation de marché

Option 1

Bien qu’une équation de marché puisse ne pas sembler être le moyen le plus évident de résoudre ce problème, nous avons imaginé un graphique en cascade dans la solution Compare avec GA3 à gauche et GA4 à droite, et chaque étape de la cascade serait un indicateur de performance sur lequel vérifier les écarts entre les deux systèmes de tracking.Cette équation de marché basique calcule les différences entre les principaux KPI pour GA4 et GA3 et traduira les variations en impact sur le Revenues.

Option 2

Une fois que nous avons identifié les KPI qui présentent les plus grandes différences, il est en fait plus intéressant de regarder les ratios des valeurs GA4 par rapport aux valeurs GA3 pour chaque métrique problématique. L’équation du marché n’est alors que le rapport entre les deux métriques :

Dataset

Option 1 (pour Datama Compare)

En plus des mesures Sessions, Transactions et Revenus, nous incluons des dimensions comparables, telles que la date, l’appareil ou le navigateur, pour voir si l’un ou l’autre de ces éléments contribue à la différence. Dans ce cas d’utilisation, les données proviennent de Google Analytics 3 et 4, extraites via les API de reporting à l’aide de Datama Prep. Nous devons créer une colonne dans les données pour indiquer si la source était “GA3” ou “GA4”. Cette opération peut être facilement réalisée et automatisée dans Datama Prep :. Un exemple de l’ensemble de données extraites peut être trouvé ici.

Option 2 (pour Datama Pivot & Impact)

Pour l’option 2, il suffit d’unpivoter le jeu de données précédent, afin d’obtenir deux colonnes d’une métrique donnée, l’une avec les données GA3 et l’autre avec les données GA4. Heureusement, cela peut être facilement fait dans Datama Prep avec le jeu de données précédent en utilisant un bloc « unpivot » : Retrouver le dataset d’exemple ici.

A retenir

À partir du graphique en cascade, nous pouvons voir qu’il existe des différences dans chacun des KPI. Dans Datama Compare en utilisant le jeu de données #1, nous pouvons voir que la plus grande différence était dans les Sessions, car leur définition est différente d’un outil à l’autre ; Les transactions et les revenus semblent être correctement suivis sur les deux outils car ils sont assez proches entre les deux outils. Par conséquent (et uniquement parce que les sessions sont différentes), la métrique de conversion est également différente. En tant que tel, nous avons fini par utiliser l’ensemble de données n° 2 dans Datama Pivot pour mieux comprendre d’où provenaient les différences dans le ratio de sessions, les sessions GA4 étant inférieures de -16 % à celles de GA3. En utilisant Datama Pivot, nous sommes en mesure d’explorer rapidement quels segments sont significativement au-dessus ou en-dessous de la moyenne.

Passer la souris sur chaque bulle affiche des détails sur les valeurs aberrantes. Dans ce cas, nous pouvons voir que le rapport Edge des sessions entre GA4 et GA3 est particulièrement faible, ce qui peut refléter un problème dans la manière dont les données sont collectées. Évidemment, ce cas d’utilisation est assez limité en termes de dimensions utilisées pour l’analyse, mais plus vous en avez, mieux c’est pour trouver les drivers. De plus, nous avons pu mettre en place un une analyse de détection d’anomalies dans Datama Detect, afin de suivre l’évolution de ce ratio (Session GA4/Session GA3) dans le temps, et d’être averti s’il sort des « valeurs anormales ». Pendant la « période de double suivi » de 2022-2023, cela permet au client de gagner en confiance dans les nouveaux chiffres de la plate-forme et de toujours pouvoir vérifier la cohérence des données avant de se lancer dans une analyse plus approfondie.

Résultats

En utilisant Datama Compare connecté à GA4 et GA3 via Datama Prep, le client a pu évaluer rapidement les principales différences de ses KPI entre les deux sources et comprendre les raisons de ces différences en se basant sur l’analyse des segments dans Datama Pivot. Ils sont désormais en mesure de surveiller cet écart au fil du temps et d’être informés de tout changement afin de trouver des problèmes de suivi ou des changements d’outils. Cette couche d’analyse a contribué au processus difficile de migration des outils d’analyse Web en permettant de gagner du temps sur l’analyse et en automatisant la surveillance et les alertes.

Partagez l'article

Abonnez-vous à notre newsletter