Semalt révèle un guide pour supprimer le faux trafic de votre site

Le spam de référence est le produit de spambots envoyant directement du faux trafic à Google Analytics, apparaissant ainsi dans les rapports de trafic générés. Prenez des mesures pour supprimer le spam de référence si vous en trouvez dans les rapports GA afin d'obtenir des statistiques précises pour le site.

Artem Abgarian, le Senior Customer Success Manager de Semalt Digital Services, partage ici quelques problèmes pratiques à cet égard.

Qu'est-ce qu'un Bot?

Les bots sont des programmes développés pour exécuter des tâches de manière répétitive rapidement et avec précision. Les robots étaient initialement destinés à l'indexation de pages sur Internet par les moteurs de recherche . Au fil des ans, les personnes malveillantes ont adopté l'utilisation de robots pour les aider à créer des fraudes par clics, à transférer le contenu d'un site, à diffuser des logiciels malveillants, à accumuler des adresses e-mail et à surévaluer le trafic sur le site.

Bots sûrs et malveillants

Un exemple de bon robot est le Googlebot qui explore et indexe les pages pour les utilisateurs. Les robots de recherche n'exécutent pas JavaScript (la plupart d'entre eux). Néanmoins, ceux qui l'utilisent se retrouvent sur les rapports de l'AG, ce qui pourrait nuire à la représentation métrique. S'ils n'exécutent pas JavaScript, il n'y a aucun impact sur les rapports, mais ils apparaissent malgré tout dans les journaux du serveur. Ils peuvent cependant affecter la vitesse de chargement car ils utilisent les ressources du serveur. Les robots sécurisés adhèrent aux directives contenues dans le fichier robots.txt. Les robots malveillants, en revanche, mettent en œuvre diverses stratégies pour contourner ces directives.

Spam Bots

Leur objectif principal est de visiter le plus grand nombre de sites Web possible et d'envoyer du spam avec des en-têtes de référence pour éviter la détection. Le faux en-tête de référence intègre un lien de redirection vers le site qu'ils souhaitent promouvoir. Les requêtes HTTP d'un tel robot apparaissent dans les journaux du serveur et indexées par Google. Il agit comme un lien retour vers le site lorsqu'il apparaît dans le journal du serveur. Google a modifié ses algorithmes pour ne pas indexer les données des journaux du serveur, contrecarrant ainsi les efforts des développeurs de spambots. Les robots de spam gérés par JavaScript peuvent passer les filtres GA, c'est pourquoi ils se reflètent dans les rapports.

Botnet

Les botnets comprennent plusieurs ordinateurs infectés pour former un réseau contrôlé par le spammeur. Il utilise différentes adresses IP pour attaquer un seul site Web. Plus le botnet est grand, plus le taux de réussite de l'infiltration est élevé. Le trafic provenant d'un botnet apparaît comme du trafic direct car il provient d'un autre ordinateur, ce qui le rend plus difficile à détecter. En bloquer un, n'aurait pas beaucoup d'impact car un autre prend sa place.

Bots de spam hautement malveillants

Leur objectif principal est de recruter un ordinateur pour faire partie d'un botnet en l'infectant avec des logiciels malveillants. L'ordinateur est ensuite utilisé pour distribuer le même malware sur d'autres ordinateurs. Le blocage d'un botnet peut empêcher le trafic entrant de visiteurs réels. Les redirections suspectes du rapport de trafic de référence conduisent principalement à ces sites Web infectant les logiciels malveillants. Évitez de cliquer sur ces liens sauf si un logiciel anti-malware efficace est installé ou un ordinateur distinct.

Smart Spam Bots

Ces sites Web envoient du trafic vers Google Analytics en utilisant son code de suivi avec l'ID du site. Ils incluent également de faux référents dans le rapport de trafic, qui peuvent rester insoupçonnés. Leurs activités n'apparaissent jamais dans les journaux du serveur et il n'y a aucun moyen de les bloquer car ils envoient des données directement à l'outil d'analyse. Les personnes qui n'utilisent pas Google Tag Managers ont le code de suivi GA sur leur site, qui agit comme un identifiant de propriété Web. Google Tag Manager est un outil efficace pour supprimer le spam référent dans ce cas. Les spambots attaquent principalement les sites criblés de vulnérabilités dans le code source ou ceux avec des mesures de sécurité limitées.

Détection des sources de spam

Accédez aux rapports de trafic Google et utilisez les taux de rebond comme élément de tri, par ordre décroissant. Ceux qui ont des taux de rebond de 100% ou 0% devraient être suspectés de spam. Alternativement, il existe une liste exhaustive des spammeurs déjà établis avec lesquels vous pouvez comparer, sans avoir à effectuer d'analyse manuelle. L'étape suivante consiste à les bloquer.

Assurez-vous de créer une notation sur le graphique du rapport expliquant où il y a eu une explosion de trafic à ce moment-là.

1. Utilisez le moteur de réécriture pour le fichier .htaccess et utilisez les capacités de Spambot pour supprimer le spam de référence en y apportant des modifications. Si vous êtes sûr de l'adresse IP utilisée par le spambot, incluez-la dans le code et refusez-lui l'accès. La capacité peut être utilisée pour bloquer des plages d'adresses IP. Ne faites cela que si vous êtes sûr que le spambot utilise plusieurs adresses IP pour effectuer une seule action. En outre, empêchez les utilisateurs connus d'utiliser des spambots.

2. Fonction de filtrage des robots: cochez la case qui vous invite à exclure les robots et araignées connus.

3. Surveillez les journaux du serveur: faites fuir les robots en visitant régulièrement le site. Utilisez un pare-feu pour protéger l'ordinateur de l'espace virtuel en filtrant les sources Web des spambots.

4. L'administrateur du système devrait être en mesure d'offrir une assistance professionnelle.

5. Le code ItSAlive aide à protéger les métriques de Google et Yandex des interférences des spambots.

6. Google Chrome est capable de détecter les logiciels malveillants et convient à la navigation s'il n'y a pas de pare-feu en place.

7. Les alertes utilisateur sont des notifications personnalisées de Google qui avertissent en cas de flambée de trafic inattendue.

8. Filtres Google Analytics. Créez de nouveaux filtres dans la section d'affichage de l'onglet Admin dans GA.