L’utilisation de RegEx (ou expressions régulières) avec Google Analytics est une méthode avancée de filtrage qui pourra vous permettre de gagner (beaucoup) de temps et est utilisée tout les jours par les professionnels et votre agence Google Analytics. En effet, la puissance des RegEx est un excellent moyen de raccourcir et d’optimiser les différents segments et filtres que vous voudrez mettre en place pour construire des rapports en accord avec vos besoins.
Même si vous avez toujours la possibilité de passer par les filtres classiques, la maîtrise des Regex pour Google Analytics vous permettra de franchir un palier significatif dans l’utilisation de cet outil populaire de statistiques de trafic. Comme vous n’avez pas besoin de maîtriser les RegEx de A à X, voici une présentation rapide et accessible à tous de l’essentiel des possibilités d’emploi des expressions régulières avec Google Analytics.
1. Les RegEx expliqués par l’exemple
La richesse du potentiel des RegEx est assez incroyable car c’est un langage complexe avec de nombreuses subtilités, que nous éviterons volontairement ici.
En effet, dans votre utilisation quotidienne de Google Analytics,vous n’aurez généralement besoin que des quelques caractères présentés dans les tableaux ci-dessous avec leur signification (simplifiée) accompagnée d’exemples sur ce qui matche ou ne matche pas cette expression régulière.
. (Point) | ||
Description | Je veux n’importe quel caractère. | |
Exemples | m.ch.l | kpulse.fr |
Matche |
|
|
Ne Matche pas | michael |
|
(Backslash) | ||
Description | Je veux annuler « l’effet RegEx » du caractère suivant. | |
Exemples | 123.222.210.123 | kpulse.fr |
Matche |
|
|
Ne Matche pas |
|
|
^ (Circonflexe) | ||
Description | Je veux que l’expression commence par les caractères suivants. | |
Exemples | ^eur | |
Matche |
|
|
Ne Matche pas |
|
|
$ (Dollar) | ||
Description | Je veux que l’expression finisse par les caractères précédents. | |
Exemples | alt$ | com$ |
Matche |
|
|
Ne Matche pas |
|
|
| (Pipe) | ||
Description | Je veux les caractères suivants ou précédents. | |
Exemples | bleu|blanc|rouge | facebook|twitter |
Matche |
|
|
Ne Matche pas |
|
|
+ (Plus) | ||
Description | Je veux une ou plus fois le caractère précédent. | |
Exemples | michel+ | go+gle |
Matche |
|
|
Ne Matche pas |
|
|
? (Point d’interrogation) | ||
Description | Je veux zéro ou une fois le caractère précédent. | |
Exemples | forte? | goo?gle |
Matche |
|
|
Ne Matche pas |
|
|
* (Étoile) | ||
Description | Je veux zéro ou plus fois le caractère précédent. | |
Exemples | mdr* | google.*com |
Matche |
|
|
Ne Matche pas |
|
|
( ) (Parenthèses) | ||
Description | Je veux grouper les caractères inclus entre les parenthèses. | |
Exemples | (pre|de)(voir|faire) | google.(com|fr) |
Matche |
|
|
Ne Matche pas |
|
|
[ ] (Crochets) | ||
Description | Classe les caractères inclus entre les crochets. | |
Exemples | [aeiouy] | ab[2468]cd |
Matche |
|
|
Ne Matche pas |
|
|
{X} ou {Y,Z} (Accolades) | ||
Description | Je veux exactement X fois ou de Y à Z fois le caractère précédant les accolades. | |
Exemples | a{3} | b{2,5} |
Matche |
|
|
Ne Matche pas |
|
|
X-Y (Tiret) | ||
Description | Je veux un caractère inclus entre X et Y. | |
Exemples | [0-9] | [a-Za-Z] |
Matche |
|
|
Ne Matche pas |
|
|
2. Les RegEx et Google Analytics
2.1. Quand utiliser les RegEx
Les RegEx et Google Analytics se rencontrent à de nombreuses occasions :
- Création de filtres
- Création d’objectifs
- Édition d’entonnoir d’objectifs
- Création de rapports personnalisés
- Création de segments avancés
- Etc.
Ouvrez un formulaire d’édition de filtre dans Google Analytics, choisissez la dimension puis sélectionnez « Correspondance avec expression régulière ».
Comme vous pouvez le voir dans la capture d’écran ci-dessus, c’est une des options de filtrage proposées dans la liste déroulante des différentes interfaces citées précédemment. Elle est donc très facilement accessible pour la création de n’importe quel filtre dans Google Analytics.
2.2. Exemples concrets d’utilisation des RegEx
Les scénarios d’utilisation des RegEx avec Google Analytics sont aussi nombreux que les dimensions de segmentation de trafic et les combinaisons qu’elles peuvent former pour les besoins de vos filtres.
De manière générale, et quels que soient vos besoins, gardez vos expressions régulières aussi simples que possibles tout en vous assurant de garder le bon degré de permissivité voulu dans vos critères de sélection (pas trop de « .* » et autant d’ancrage que possible avec « ^ » et « $ »). Et surtout n’oubliez pas le caractère d’échappement « » pour éviter les problèmes sur les métacaractères.
Je veux… | Dimensions | RegEx à utiliser |
Les pages dont l’URL débute par « /blog/ ». | URL | ^/blog/(.*) |
Les recherches incluant l’expression « coca cola » avec ou sans espace. | Mot clé | (cocas*?cola) |
Les recherches débutant par « coca » suivi de « cola » ou « kola » | Mot clé | ^cocas+([ck]ola) |
Les URL terminant par « .php » | URL | .php$ |
Les recherches exactes sur le terme « eurekalt » | Mot clé | ^eurekalt$ |
Les recherches incluant des termes de questionnement | Mot clé | (comment|pourquoi) |
Les visiteurs venant du Bénélux | Pays | (Belgium|Netherlands|Luxembourg) |
Les visiteurs venant de produits iOS ou Android | Système d’exploitation | (iOS|Android) |
Les écrans de moins de 800 pixels de large | Résolution d’écran | (^[1-7]?[0-9]?[0-9])x([1-5]?[0-9]?[0-9]$) |
Les expressions de recherche longue d’un seul mot | Mot clé | ^s*[^s]+(s+[^s]+){0}s*$ |
Les expressions de recherche longue de deux mots | Mot clé | ^s*[^s]+(s+[^s]+){1}s*$ |
Les expressions de recherche longue de trois mots | Mot clé | ^s*[^s]+(s+[^s]+){2}s*$ |
Les expressions de recherche longue de 4 mot ou plus | Mot clé | ^s*[^s]+(s+[^s]+){3,}s*$ |
Les expressions contenant des termes liés au « web analytics » en considérant les erreurs de saisie possibles. | Mot clé | webs?anal+[iy]t[iy](c|que)s? |
Les pages contenant « 404error.html » dans l’url | URL | 404error.html |
Les URL commençant par exactement deux chiffres | URL | ^[0-9]{2} |
Avec caractères spéciaux () ou $ ou . ou [] ou * | – | ( ) $ . [ ] * |