Le détournement d’URL
Egalement connu sous le nom de “manipulation d’URL” (“URL Injection” en anglais) ou encore d’hébergement parasite ("Parasite Hosting"), ce type de piratage consiste à ajouter une ou plusieurs pages cachées comprenant du contenu et/ou des liens indésirables sur un site Internet à l’insu de son propriétaire. Dans le présent cas d’étude, les pages parasites redirigent le plus souvent vers une boutique en ligne de produits contrefaits (sacs, vêtements, montres, médicaments, etc.).
L’objectif de ce procédé est d’améliorer de façon notoire le référencement du site principal de vente de contrefaçon et de ses pages satellites. Pour maximiser le résultat, cette technique de hacking est répétée sur une multitude de sites web parfaitement légaux. Quant aux pages satellites, elles sont elles-mêmes reliées entre elles formant un véritable réseau. Les robots des moteurs de recherche, bernés, font alors monter chacune des pages qu’ils détectent comme populaires sur les mots-clés choisis.
Du point de vue technique, l’attaque du site est rendue possible grâce à une faille dans le système ou à un mot de passe corrompu. Il est peu probable que les contrefacteurs aient développé des compétences avancées en la matière et qu’ils fassent le travail eux-mêmes. On peut donc supposer qu’ils emploient des spécialistes, d’autant que cette prestation est facile à trouver sur le “darknet”.
Les sites légitimes peu sécurisés et dotés d’un bon référencement naturel sont des cibles privilégiées. Ainsi, des milliers de sites d’hôpitaux, d’églises, de municipalités ou encore de PME sont régulièrement piratés par les “hackers” tandis que certains noms de domaine bénéficiant d’un trafic ou d’un référencement intéressant sont rachetés pour être intégrés à la nébuleuse.
Le Black Hat SEO
Les “hackers” ne se contentent pas seulement de pirater des centaines voire des milliers de sites tout à fait légitimes. Ils font également appel à un large éventail de techniques de référencement abusif contraires aux consignes et règles de bon usage des moteurs de recherche. Celles-ci sont communément appelées Black Hat SEO (Search Engine Optimisation), par opposition au White Hat SEO, qui lui est parfaitement autorisé et conforme.
Il en existe environ une vingtaine. Elles visent à tromper à la fois les robots des moteurs de recherche et les utilisateurs humains dans le but d’augmenter de façon non autorisée le trafic et le référencement. Les plus répandues dans le cadre de la contrefaçon en ligne sont décrites ci-dessous.
Le bourrage ou la multiplication de mots-clés (“Keyword Stuffing”) consiste à répéter un mot-clé ou une série de mots-clés, en général sur une bonne partie voire l’intégralité d’une page web. Exemple : “Sacs pas cher, sacs bonnes affaires, sacs pas cher, sacs bonnes affaires, sacs pas cher…”.
La dissimulation de contenu (“Cloaking”) consiste à générer un contenu HTML différent selon qu’il s’agit d’un visiteur humain ou d’un moteur de recherche. Exemple : un utilisateur fait des recherches sur un produit ou un service spécifique, clique sur un lien qui semble être en rapport avec le sujet au vu du titre et de la description et se retrouve sur un site dont le contenu n’a rien à voir (vente en ligne de faux médicaments, pornographie, etc.).
L’ajout de texte ou de liens invisibles (“Tiny Text, Hidden text, Hidden Links”) consiste à insérer du contenu ou des liens destinés aux robots et indétectables à l’oeil nu. Exemple : placement de mots-clés de la même couleur que le fond de la page Web.
La duplication de contenu ou la création de sites miroirs (“Duplicate Content, Mirror Sites”) consiste à reproduire une grande quantité de texte ou à copier un site web. Exemple : un site de contrefaçon qui utilise un copier-coller du site officiel d’une marque de luxe.
Depuis plusieurs années, Google combat le Black Hat SEO, en particulier avec les mises à jour Panda et Penguin, qui permettent de traquer ces violations et de bannir les sites au contenu indésirable ou de moindre qualité des pages de recherche.
Ces pratiques illicites de manipulation des résultats ne sont donc pas viables sur le long terme. Toutefois, elles conviennent parfaitement aux sites de contrefaçons qui ont une durée de vie limitée et mettent en place des stratégies à court-terme en raison des actions de répression engagées par les autorités et les marques.
Leur positionnement en tête du classement des résultats de recherche leur permet, même sur une très courte période, de faire exploser leurs ventes et donc leur chiffre d’affaires. Pour assurer la continuité de leurs activités, il leur suffit d’avoir un ou plusieurs autres sites sous la main qu’ils pourront réactiver dès lors que le site précédent recevra une pénalité et ainsi de suite.
En conclusion, malgré les sanctions instaurées par Google et les modifications régulières de son algorithme, les hackers parviennent à s’adapter rapidement. Une simple recherche manuelle sur ce moteur de recherche permet de détecter un volume significatif d’URLs piratées combinant parfois plusieurs méthodes de référencement abusif. Sur certaines requêtes populaires comme par exemple “nom de la marque + pas cher”, elles peuvent représenter jusqu’à 80% des résultats par page. Le Black Hat SEO semble donc avoir encore de beaux jours devant lui.