VEILLE ET ACTUALITÉS DES NOUVEAUX MÉDIAS

LE BLOG DE PERSPECTIVES COMMUNICATION

SPAM REFERRERS - SAUVEZ VOS STATISTIQUES (Google Analytics)

Lutter contre les spam referrer
Si vous utilisez Google Analytics pour suivre et analyser le trafic de fréquentation de votre site Internet, vous êtes certainement victime depuis quelque temps des attaques malveillantes de "Spam Referrers". Dans cet article, nous allons analyser le phénomène des "SPAM REFERRER", voir comment on peut les détecter et s’en prémunir pour garder des statistiques "propres".


Qu'est-ce que le Spam Referrer ?


"Referrer" désigne l'URL de la page d'où vient l'internaute. Il s'agit d'une information essentielle pour les outils statistiques. Ainsi via le tracking du referrer, on peut savoir combien de visites ont rapporté un site, une page ou une publicité.

Mais depuis quelques temps, les statistiques sont de plus en plus investies par des sites indélicats qui voient dans ce procédé le moyen d'augmenter artificiellement leur trafic (ou d'attirer des prospects éventuels). C'est pourquoi beaucoup de liens mènent à des sites de SEO (proposition de boutons de partage sur les réseaux sociaux), ou des redirections vers des sites de ventes en ligne (souvent des sites de contrefaçons). D'autres sites sont bien plus douteux.

Le principe des Referrer Spams


Comme tous les webmasters ou propriétaires de sites Internet ou de blogs, vous consultez régulièrement les statistiques de fréquentation de vos sites. Pour savoir si l'on parle de vous ou si votre campagne de pub a fait effet, vous êtes particulièrement attentif à l'origine de vos visites. Parfois, vous voyez apparaître de nouvelles provenances de visites, et tout naturellement, vous allez cliquer sur ce nouveau lien inconnu. Ou bien vous voulez vérifier que certains sites n'utilisent pas vos données à votre insu (comme les site de type free-share-buttons ou buttons-for-your-website, qui proposent des boutons de partage vers les réseaux sociaux).

C'est le but du spam referrer. Vous cliquez sur le lien, et hop ! voici une nouvelle visite à leur bénéfice. A l'échelle mondiale, ça peut faire un maximum de visites. C'est ce qu'on appelle une technique "Black Hat", c'est à dire une vile manoeuvre pour tromper les moteurs de recherche dans le but leur faire croire à la popularité d'un site.

  Détecter les Referrer Spams

À leur nom

D'abord à leur nom, qui tourne autour des mêmes thèmes : free-share-buttons, best-seo-offers, buttons-for-your-website, get-free-traffic, buy-cheap-online, youporn, sexyteens, forum-darodar etc. ou qui se cachent derrière des noms à l'apparence plus "respectables" tels que hulfingtonpost, theguardian, googlsucks…

Au nombre de pages par session

La plupart du temps, les liens arrivant de ces sites ne "consultent" qu'une page par session et génèrent un taux de rebond de 100%. Tout en vous faisant croire à la visite d'un nombre plus ou moins important de nouveaux visiteurs. De plus, il ne ciblent généralement que la home page de votre site.

detecter les spam referrer par les sessions
Détecter les Spam Referrer par les sessions et leur durée

Une façon simple de détecter les Referrer Spam, est de regarder le nombre des sessions (100%) et leur durée moyenne (00:00:00). Cependant, ce critère est susceptible d'évoluer pour rendre la détection des spams moins évidente.

Les différents types de Spam Referrer

Il en existe deux types : le "Ghost Referrer Spam" et le "Crawler Referrer Spam"

Les ghosts referrer spams

Le Ghost Referrer Spam

ghost50darodar.com / social-buttons.org / hulfingtonpost.com…
C'est la grande majorité des Spams Referrer. Il est appelé "Ghost" (fantôme) car ce type de Spam n'accède pas vraiment à votre site. Il cible directement votre Google Analytics et n'apparaît que dans vos statistiques. Il vous identifie via l'ID de tracking Google dans l'unique but d'obtenir du trafic de votre part, gageant que vous serez curieux de savoir qui a visité votre site.

La meilleure façon de détecter les Ghost Referrer Spams est de vérifier leur "hostname" (nom de domaine général de la page demandée.). Ce type de spam utilise un nom de domaine non renseigné (not set) ou un faux (ex. frxjpiwyoog). En d'autres termes, tous les noms d'hôtes de vos statistiques qui ne sont pas logiques doivent être considérés comme des Ghost Referrer Spams.

Les Ghost Referrer Spams utilisent de faux noms d'hôte et n'accèdent pas vraiment à votre site. C'est la raison pour laquelle l'usage du .htaccess pour les bloquer est parfaitement inopérant.

Détecter les ghosts-refferer-spams
Détecter les ghosts-refferer-spams

Pour détecter les Ghost Referrer Spams, allez dans votre Google Analytics > Rapport > Acquisition > Canaux. Choisissez Referral* > Dimension secondaire > Nom d'hôte. Votre nom d'hôte n'y est pas mentionné car lorsque le script est lancé, il ignore quels sont les sites qui vont être ciblés. A la différence des Crawler Referrer Spams qui utilisent des noms de domaine valides.
* Site référent


Les crawler referrer spams

Le Crawler Referrer Spam

crawler50semalt, buttons-for-website, best-seo-solution…
Un "Web Crawler" est un robot (un "bot") qui parcourt l'Internet dans le but d'indexer les pages de votre site (comme par exemple Google).
Le Crawler Referrer Spam agit de façon identique mais dans l'intention de se servir de vous pour générer du trafic sur son propre site. Ces robots outrepassent volontairement les règles édictées par votre fichier "robot.txt" qui vous sert à bloquer les accès de certaines de vos pages que vous ne souhaitez pas voir indexées.

Les Crawler Referrer Spams utilisent de vrais nom d'hôtes et accèdent à votre site. Vous pouvez donc les bloquer via le htaccess. Le problème c'est qu'il y en a vraiment beaucoup, ce qui alourdit le fichier et rend moins fluide la navigation vers les pages de votre site. Dans ce cas, il est possible de filtrer les statistiques en ciblant les spams dont vous êtes spécifiquement victimes.

Comment bloquer les Spams Referrer ?

Les Ghost Referrer Spams ne peuvent être bloqués que par des filtres à l'intérieur de votre Google Analytics.
Les Crawler Referrer Spams peuvent être bloqués au choix via le htaccess ou des filtres Google Analytics.

À NOTER
Les filtres Google Analytics ne sont pas rétro-actifs. si vous voulez consulter (ou présenter à votre client) des statistiques "propres", je vous conseille l'utilisation des segments.


Les filtres

Pour bloquer les Crawler Referrer, utilisez les scripts prédéfinis et bloquez les noms d'hôtes indésirables que vous retrouvez dans vos variables "campagnes".
Vous pouvez aussi appliquer un filtre régional. Si vous remarquez que les spams arrivent principalement de Russie et que vous n'avez aucun intérêt à vous adresser aux russes, vous pouvez bloquer toutes les visites arrivant de ce pays.

Exemple de filtre d’exclusion des crawler-spams referrer
Créer un filtre d’exclusion des crawler-spams referrer

À NOTER
Contrairement aux segments qui peuvent être modifiés à tout moment et immédiatement applicables, les filtres appliqués changent de façon permanente vos statistiques. Si vous vous êtes trompés dans la définition de votre filtre, vous ne pourrez pas l'annuler pour la période où il a été en exercice.

Pour être sûr que votre filtre est correct, dans l'admin, cliquez sur "Filtre", la liste de vos filtres s'affiche et vous pouvez les tester sur les statistiques de vos 7 derniers jours. Si le résultat ne vous convient pas, vous pouvez le modifier ou le supprimer.

De plus, l'application des filtres n'est pas immédiate. Vous devrez attendre environ 24 heure pour que votre filtre fasse effet.


Les segments

Au secours, mon client veut voir ses statistiques et je ne peux pas lui montrer ses Google Analytics complètement spammées… Que faire ?"
Personne n'a envie d'expliquer à un client le principe des Spams Referrers qu'il ne comprendra pas forcément. Donc pour présenter à votre client (ou simplement pour votre confort de lecture personnel), je vous conseille l'utilisation des segments qui vous permettront de présenter des statistiques "propres" et surtout, rétroactives.
Les segments sont des "sous-ensemble" de vos statistiques, qui peuvent être combinés entre eux et vous permettent de n’afficher que certains types de visites ou d’en exclure d’autres…

Deux méthodes d'exclusion des sites spammeurs
Vous pouvez passer en revue tous les spams de vos analytics et les traiter comme ci-dessous, en utilisant, soit l’adresse complète du site spammeur, soit les mots-clés qui s’y retrouvent le plus souvent…
Exemples de conditions à entrer dans votre Google Analytics
Les segments Google Analytics seront très utiles pour garder vos données statistiques de fréquentation "propres"

Si vous tâtez un peu du code, vous pouvez utiliser les expressions régulières
   Comment procéder :
Dans votre Google Analytics, allez sur Admin > Segments > Nouveau segment > Avancé > Conditions et nommez-le, puis suivez l’exemple ci-dessous :

Conditions, utiliser les expressions régulières
Filtre > Source > exclure les sources qui correspondent à l’expression régulière

Pour le site perspectives-communication.com, j'ai créé l'expression régulière suivante, pour exclure les sites référents indésirables :

.*((free\-social\-buttons|sanjosestartups|event\-tracking|ilovevitaly|free\-social\-buttons|Get\-Free\-Traffic\-Now|
www7\.free\-social\-buttons)\.com|guardlink\.org|howtostopreferralspam\.eu|непереводимая\.рф).*


avant-apres-exclusion
Comparaison des statistiques avant (Toutes les sessions) et après l’exclusion (application du segment ER-Perspectives)
Sachez que vous devrez y revenir périodiquement car les sites en question changent. Certains disparaissent, d'autres font leur apparition… Et pour l'instant, aucune parade n'est proposée par Google. Mais, rassurez vous, si cette pollution de statistiques est pénible, elle n'a aucun impact négatif sur votre ranking.


Pour aller plus loin…

Supprimez le spam referrer :-) par Olivier Duffez (article du 2 décembre 2016)

[RETOUR]

blog comments powered by Disqus