Use case #2 : Identifier les écarts de data entre GA3 et GA4

Catégorie: Performance | Solution : Datama Compare, Datama Pivot | Type : Ad hoc | Client : Web travel | Extension : Aucune Tags: #Occupation #Stock #Conversion

Contexte

Le client est un acteur majeur de l’hôtellerie en France.  Avec le passage prochain de GA3 (Universal Analytics) à GA4, l’équipe chargée de l’analyse des données a commencé à faire passer ses rapports web à GA4. Au cours de ce processus, elle a remarqué des divergences dans ses principaux indicateurs clés de performance, tels que les sessions, les transactions et les revenus. Cependant, elle avait besoin d’un moyen d’identifier systématiquement toutes ces différences entre les deux versions afin de déterminer s’il existait des dimensions à l’origine de ces écarts.   En d’autres termes, ils avaient besoin d’un moyen rapide de voir les différences entre GA3 et GA4 et les causes possibles.

Approche

Équation de marché

Option 1

Bien qu’une équation de marché puisse ne pas sembler être le moyen le plus évident de résoudre ce problème, nous avons imaginé un graphique en cascade dans la solution Compare avec GA3 à gauche et GA4 à droite, et chaque étape de la cascade serait un indicateur de performance sur lequel vérifier les écarts entre les deux systèmes de tracking.

Cette équation de marché basique calcule les différences entre les principaux KPI pour GA4 et GA3 et traduira les variations en impact sur le Revenues.

Option 2

Une fois que nous avons identifié les KPI qui présentent les plus grandes différences, il est en fait (et pour une fois dans Datama !) plus intéressant d’examiner les ratios des valeurs GA4 par rapport aux valeurs GA3 pour chaque mesure problématique. L’équation du marché n’est alors que le rapport entre les deux métriques :

Dataset

Option 1 (pour Datama Compare)

En plus des mesures Sessions, Transactions et Revenus, nous incluons des dimensions comparables, telles que la Date, l’Appareil ou le Navigateur pour voir si l’un ou l’autre de ces éléments contribue à la différence. Dans ce cas d’utilisation, les données proviennent de Google Analytics 3 et 4, extraites via les API de reporting à l’aide de Datama Prep.  Nous devons créer une colonne dans les données pour décrire si la source était ‘GA3’ ou ‘GA4’. Ceci peut être facilement réalisé et automatisé dans Datama Prep :Vous trouverez un exemple de l’ensemble de données extraites.  ici.

Option 2 (pour Datama Pivot & Impact)

Pour l’option 2, il suffit de dépivoter l’ensemble de données précédent afin d’obtenir deux colonnes d’une mesure donnée, l’une avec les données GA3 et l’autre avec les données GA4. Heureusement, cela peut être facilement fait dans Datama Prep avec l’ensemble de données précédent en utilisant un bloc unpivot : Un exemple des données transformées peut être trouvé.  ici.

A retenir

Le graphique de la chute d’eau montre qu’il existe des différences dans chacun des indicateurs clés de performance. Dans Datama Compare, en utilisant l’ensemble de données n° 1, nous pouvons voir que la différence la plus importante concerne les sessions, car leur définition est différente d’un outil à l’autre ;   Les transactions et les revenus semblent être correctement suivis sur les deux outils car ils sont assez proches entre les deux outils. Par conséquent (et uniquement parce que les sessions sont différentes), la mesure de la conversion est également différente.   Ainsi, nous avons fini par utiliser l’ensemble de données n°2 dans Datama Pivot pour mieux comprendre où se situaient les différences dans le ratio des sessions, les sessions GA4 étant inférieures de -16% à celles de GA3. En utilisant Datama Pivot, nous sommes en mesure d’explorer rapidement les segments qui sont significativement supérieurs ou inférieurs à la moyenne.  

En survolant chaque bulle, vous obtiendrez des informations spécifiques sur les valeurs aberrantes. Dans ce cas, nous pouvons voir que le ratio Edge des sessions entre GA4 et GA3 est particulièrement bas, ce qui pourrait refléter un problème dans la manière dont les données sont collectées. Il est évident que ce cas d’utilisation est assez limité en termes de dimensions utilisées pour l’analyse, mais plus vous en avez, plus il est facile de trouver les facteurs déterminants. En outre, nous avons pu mettre en place un cas d’usage de détection d’anomalie dans Datama Assess, afin de surveiller la façon dont ce ratio (Session GA4/ Session GA3) évolue dans le temps, et d’être notifié s’il sort des « valeurs normales ». Au cours de la « période de double suivi » de 2022-2023, cela permet au client d’avoir confiance dans les chiffres de la nouvelle plateforme et de toujours pouvoir vérifier la cohérence des données avant de procéder à une analyse plus approfondie.  

Résultats

En utilisant Datama Compare connecté à GA4 et GA3 via Datama Prep, le client a pu rapidement évaluer les principales différences dans ses KPIs entre les deux sources, et comprendre les raisons de ces différences en se basant sur l’analyse des segments dans Datama Pivot. Il est maintenant en mesure de suivre cet écart dans le temps et d’être notifié de tout changement afin d’identifier les problèmes de suivi ou les changements d’outils. Cette couche d’analyse a facilité le processus difficile de migration des outils d’analyse web en permettant de gagner du temps sur l’analyse et d’automatiser le suivi et les alertes.   

Partagez l'article

Abonnez-vous à notre newsletter