Intégration des recherches sur site dans les statistiques Google Analytics

Introduction

Un précédent article paru au mois de janvier 2011 présentait la création, l'adaptation et l'intégration du moteur de recherche personnalisé Google au sein de SQLPAC : Création et adaptation des moteurs de recherche personnalisés Google (CSE - Custom Search Engine)

3 critères sont implémentés dans le moteur de recherche intégré au sein du site SQLPAC :

  • Requête (champ texte).
  • Catégorie (liste déroulante).
  • Périmètre (boutons radio).

Les adresses URL associées au moteur de recherche ont la forme suivante :

/recherche?q=<mots clés>&categorie=<catégorie>&perimetre=[all|htm]

Avec l'exemple ci-dessus (recherche sur le mot clé dbcc)

Recherche dans toutes les catégories et tout type de contenu (articles, news, thèmes...) :

Adresse URL Requête Google
/recherche?q=dbcc&categorie=all&perimetre=all   
dbcc

Recherche uniquement dans la catégorie Sybase et tout type de contenu (articles, news, thèmes...) :

Adresse URL Requête à Google
/recherche?q=dbcc&categorie=sybase&perimetre=all
sybase dbcc

Recherche uniquement dans la catégorie Sybase et uniquement dans les articles :

Adresse URL Requête Google
/recherche?q=dbcc&categorie=sybase&perimetre=htm
sybase dbcc filetype:htm OR filetype:html OR filetype:pdf

Analyser les recherches effectuées par les internautes sur le moteur de recherches intégré à son site est très important car cette analyse permet d'appréhender précisément ce que recherchent les internautes lors de leur navigation dans le site.

Cet article présente les 2 méthodes alternatives permettant d'extraire ces informations depuis Google Analytics (hors APIs d'export de données), l'intégration de la recherche sur site dans Google Analytics étant de loin la plus efficace. Pour chacune des méthodes, la maîtrise des URLs lors des recherches demeure indispensable.

Recherche sur site dans Google Analytics

Activation et paramétrage de la recherche sur site dans Google Analytics

L'intégration de la recherche sur site dans Google Analytics est une nouveauté de novembre 2007 mais demeure relativement cachée.

Dans la page d'accueil du compte Google Analytics, cliquer sur le lien "Modifier" pour le site :

La page des paramètres de profil pour www.sqlpac.com s'affiche et indique si la recherche sur site est activée ou non (Informations relatives au profilRecherche sur site).

Informations relatives au site - Paramètres du profil

Si la recherche sur site n'est pas activée (Ne pas effectuer le suivi de la recherche sur site), cliquer sur le lien "Modifier".

La page "Modifier les informations sur le profil" propose alors à la fin un paragraphe intitulé "Recherche sur site", paragraphe contenant le formulaire consacré au paramétrage de la recherche sur site dans Google Analytics.

Paramétrage de la recherche sur site
L'activation du suivi de la recherche sur site est réalisée en cochant le bouton radio "Effectuer le suivi de la recherche sur site". Activation recherche sur site
La ou les variables utilisées pour les mots clés dans les adresses URL sont indiquées dans le champ "Paramètre de requête".
/recherche?q=dbcc&categorie=all
Recherche sur site paramètre de requête
La ou les variables utilisées pour les catégories dans les adresses URL sont indiquées dans le champ "Paramètre de catégorie".
/recherche?q=dbcc&categorie=sybase
Recherche sur site paramètre de catégorie

Que signifient les options "Oui, supprimer les paramètres de requête de l'URL" et "Oui, supprimer les paramètres de catégorie de l'URL" ?

Afin de ne pas obtenir dans le tableau de bord général "ContenuDétail des pages par URL" toutes les entrées avec les divers mots clés et catégories, exemple :

Page Pages vues
/recherche?q=baie+configuration&categorie=all 2
/recherche?q=2k+to+4k&categorie=all 2
... ...

Ces 2 options indiquent à Google, dans le tableau de bord général, de supprimer les paramètres de requête et de catégorie dans les adresses URLs et ainsi aggréger les statistiques sur les URLs contenant ces paramètres.

Page Pages vues
/recherche?sa=+ 28

Les tableaux de bord de la recherche sur site avec Google Analytics

Dès le suivi de la recherche sur site activé, le tableau de bord propose le nouveau menu "ContenuRecherche sur site". Le rapport sur les termes de recherche est le plus intéressant : il regroupe dans un tableau tous les mots clés, au format lisible, saisis par les internautes dans le moteur intégré.

Menu Recherche sur site Recherche sur site - Termes de recherche

Toutes les adresses /recherche?q=détruire+un+dbf etc... sont traduits dans un format lisible dans ce rapport des termes de recherche.

Parmi les autres informations dans ce nouveau menu "Recherche sur site" (la liste n'est pas exhaustive) :

  • le taux de visite avec recherche sur site.
  • dans quelles catégories les visiteurs ont effectué leur recherche.
  • où les visiteurs ont commencé leur recherche et quelles pages ont été trouvées

Utilisation des segments avancés

L'intégration du suivi de la recherche sur site est la plus efficace pour les analyses, mais pour ceux qui n'ont pas encore activé cette option, l'utilisation des segments avancés est une bonne solution pour analyser les statistiques déjà enregistrées.

Par exemple, créér un segment avancé "SEARCHENGINE" (Mes personnalisations Segments avancés), segment qui réalise un filtre sur la ou les adresses URLs dédiées à la recherche : /recherche dans ce cas

Segment avancé SEARCHENGINE

Le tableau de bord "ContenuDétail des pages par URL" pour le segment SEARCHENGINE liste alors toutes les URLs pour les pages contenant /recherche :

Page Pages vues
/recherche?q= +Flash+Recovery+Area+Usage 2
/recherche?q=2k+to+4k 1
/recherche?q=add+service 1
... ...

Ces adresses ne sont pas aisément lisibles contrairement au rapport sur les termes de recherche avec la recherche sur site intégrée dans Google Analytics.

Google Analytics propose cependant une option d'export au format CSV de ce rapport (menu du haut). Le fichier résultat peut alors retraité avec sed et awk pour extraire les mots clés dans un format lisible.

sqlpac@MSYS$ cat analytics.csv | grep '^/recherche' | sed -e "s/\/recherche?q=//g" \
                  | awk -F"," '{print $1}' | sed -e "s/&sa=+//g" | sed -e "s/+/ /g" | sort -f
Flash Recovery Area Usage
2k to 4k
8i
@printopts
add service
ajout service
baie
baie configuration
configuration pfile
cygwin
DATA PUMP
EXECUTE UTL_FILE privileges to PUBLIC
fragmentation index
gimp
index
migration ase
MMON
Msg 8009
Number of sort buffers
openquery
pagesize
pagesize 2k to 4k
raid
rechercher job
RMAN
service
sp_helptext
statpack interpretation
streams
sybase ase
tablespace
TTS
zfs