Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

Spamdexing - bourrage de liens vers un objet Web

Spamdexing : opération tentant de manipuler les résultats des moteurs de recherche pour promouvoir quelque chose en bourrant de liens des zones de contacts.

cr  01.04.2012      r+  21.08.2020      r-  16.02.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

Il s'agit de manipuler (tromper) le calcul des indices de popularité d'un objet Web (site Web, page Web, etc.) par les moteurs de recherche.

Soyez vigilant avec les réponses à vos questions dans les moteurs de recherche. Le Spamdexing consiste à manipuler les résultats (SEO - Search Engine Optimization - Optimisation pour moteurs de recherche) pour apparaître dans les premiers, voire le premier.

Les moteurs de recherche considèrent que si le contenu d'une page Web est de nombreuses fois référencé par de nombreux liens pointant vers lui dans de nombreux sites et forums, c'est que ce contenu est pertinent pour le sujet traité.

Le jeu consiste donc, pour les margoulins, à bourrer les forums, blogs, réseaux sociaux, etc. de liens pointant vers ce qu'ils souhaitent pousser. Ce peut être n'importe quoi : cigarettes de contrebande, faux papiers, faux diplômes, prêt de particulier à particulier, molécules interdites, Viagra, fausse monnaie, escroqueries en tout genre, etc.

Un antivirus du nom de SpyHunter, par exemple, joue à ce jeu avec des centaines de sites Web satellites de son site, chacun pointant des centaines de milliers de fois vers cet antivirus, ce qui fait qu'il apparaît toujours en premier dans les moteurs de recherche.

Renseignez-vous et protégez-vous, par l'éveil de votre vigilance et avec des outils (Web Réputation, etc.).

L'internaute cherche, le moteur trouve.

Pour être dans les premiers d'un moteur de recherche, il y a deux méthodes :

  1. Acheter du trafic

    Acheter, auprès du moteur de recherche, des mots-clés. C'est, par exemple, le service Google Adwords, de la régie publicitaire de Google, la première au monde et de très loin, qui permet d'acheter du trafic. Le produit ou service apparaîtra en haut à droite des résultats de recherche ou en haut de la liste des réponses du moteur (liens publicitaires difficiles à séparer des liens normaux, bien qu'un avertissement soit obligatoire (mais quasi invisible)).

  2. Avoir naturellement du trafic

    Avoir un très bon contenu vers lequel de nombreux autres sites pointent (font un lien). Les moteurs de recherche considèrent que, si de nombreux sites pointent vers une même page du Web, c'est que celle-ci est de bonne qualité : la page est pertinente pour le sujet qu'elle traite. Cet indice de pertinence, inventé par Google, et repris depuis par les autres moteurs de recherche, est appelé « PageRank » chez Google (classement autrefois public et, désormais, totalement secret depuis le 08 mars 2016). Il est impératif, pour des Webmasters ou des marchands ne désirant ou ne pouvant pas acheter du trafic, d'avoir des pages « populaires » et donc d'avoir de nombreux liens pointant vers ces pages. Si le contenu n'est pas pertinent, le seul moyen de le rendre apparemment pertinent, au sens du « PageRank », et de bourrer le Web de liens vers ses propres pages. Ceci permet de manipuler l'index de Google. C'est le Spamdexing.

Le Spamdexing consiste à occuper le terrain (squatter le terrain) du Web afin d'améliorer le classement de l'objet à promouvoir dans les moteurs de recherche (dans Google, etc.), en trompant les dispositifs de recherche de pertinence des résultats, afin de faire « monter » une page dans l'index des moteurs pour que vous tombiez dessus lors de vos recherches. En gros, il faut apparaître dans les 10 premiers dans un moteur de recherche (or Google traite plus de 90% des requêtes en recherche).

Ces techniques d'optimisation (SEO - Search Engine Optimization) servent à promouvoir des pages Web qui ne possèdent pas les qualités naturelles pour être populaires (elles n'ont pas d'intérêt).

Normalement, seule la qualité du contenu d'une page Web doit servir à son classement. Malheureusement, il est impossible aux moteurs de recherche d'employer des centaines de milliers d'humains pour juger et classer toutes les pages Web du monde : il y en a des centaines de milliards. Des milliers de nouveaux sites naissent chaque jour et des millions de pages sont créées ou mises à jour chaque minute. Seul le crowdsourcing bénévole le permettrait. Deux expériences de crowdsourcing bénévole sont remarquables :

  1. Le projet Open Directory - Dmoz est une tentative de classement à la main, par des milliers de bénévoles, de certains sites (ceux qui en font la demande - gratuitement), par catégorie et ordre alphabétique dans la catégorie (sans classement par pertinence - site cool). Les sites peuvent être refusés au référencement et, en tout état de cause, il faut parfois plusieurs mois avant d'y être référencé. Assiste.com y est référencé.
    Dmoz n'existe plus, mais une archive est maintenue en ligne.

  2. Le moteur de recherche Blekko, de Rich Skrenta.
    Blekko n'existe plus, racheté par IBM.

La « Pertinence décroissante » est le chef d'oeuvre que :




Dans les techniques de Spamdexing, on y trouve :




Pourquoi les techniques d'indexation de Google sont plus spécialement visées?

Parce que Google est le plus important moteur de recherche, de très loin, directement ou indirectement (en plus, Google fourni ses résultats à de nombreux autres moteurs de recherche) et parce que Google est l'inventeur de cette technique qui permet de vous répondre, lorsque vous faites une recherche, d'une manière que Google croit « intelligente - pertinente » : le « PageRank ».

Google vous propose une liste de pages Web parlant du sujet sur lequel vous faites une recherche, mais Google ne vous propose pas cette liste en vrac. Il la classe selon un indice de pertinence et les pages qui apparaissent en premier lui semblent les plus pertinentes.

Tout le problème du Spamdexing vient de là ! Comment faire croire à Google qu'une page est pertinente ? Les autres moteurs de recherche sont marginaux et ne comptent pas.




Pour qu'une page Web soit « pertinente » sur un sujet donné (par exemple « sécurité informatique » ou « énergies renouvelables », etc.), aux yeux de Google, il faut que de nombreux autres sites pointent (aient un lien) vers cette page. Google pense alors que, puisque tout le monde parle de cette page, elle est « populaire », c'est donc une bonne proposition de consultation à faire à celui qui fait une recherche sur le même sujet. Donc les webmasters (ou les auteurs de trucs à promouvoir, y compris et surtout les virus, etc.) ont développé des techniques pour populariser leurs trucs (car, s'il n'y a pas d'argent au bout, cela n'a pas d'intérêt - sauf, peut-être, l'orgueil qui motive certains ou les influences du moment en période d'élections, etc.).

Nota
La pertinence ne se limite pas à la présence de nombreux liens vers un objet : elle est pondérée par la popularité du site qui pointe vers cet objet. Ainsi, lorsque Microsoft.com pointe vers une page d'Assiste.com, cela a plus d'importance, au sens du « PageRank » de Google (car le domaine Microsoft.com est extrêmement populaire), qu'un lien pointant vers la même page d'Assiste.com, mais provenant d'un micro site personnel sans popularité.

1 Mesures préventives 2 Mesures préventives Spamdexing : manipuler la pertinence des moteurs de recherche

Concernant les Webmasters, leurs zones de conversation (forums de discussion, etc.) peuvent servir à des margoulins qui vont y insérer des liens vers leurs objets promouvoir, pour les rendre populaires et violer/tromper les algorithmes de classements utilisés par les moteurs de recherche. Ces techniques de SEO crapuleuses sont combattues avec les contre-mesures au spamdexing : principe des Tests de Turing mis en oeuvre par des Captchas dont, principalement, le Captcha à trier, inviolé, et le malheureusement populaire reCaptcha. Voir les liens dans le dossier SEO - Référencement.

Spamdexing - Mesures préventives
- -

Dossier (collection) : SEO - Référencement

Webmaster tools

Techniques recommandées :
Webmaster - Sitemap
Nuage de mots-clés (nuage de tags)

Techniques pénalisantes en termes de SEO :
Spamdexing
Liens réciproques - Réciprocité
Ferme de liens
Ferme de contenu
Comment spam (spam forums, blogs, sites)
Bourrage de mots clé (Stuffing keywords)
Mascarade (Cloaking)
Contenu dupliqué (Duplicate Content)

Contre-mesures au spamdexing :
Bloquer le « Comment Spam » (Spamdexing) avec les Tests de Turing
Bloquer le « Comment Spam » (Spamdexing) avec les Capcha
Bloquer le « Comment Spam » (Spamdexing) avec les Captcha à trier
Bloquer le « Comment Spam » (Spamdexing) avec les reCaptcha


Dossier (collection) : Publicité intrusive

Dossier : Publicité sur le Web

Articles de fond
Publicité intrusive
Vidéo de démonstration de publicités contextuelles
L'IAB est contre la publicité intrusive (procès)
Banner blindness
Détournement des revenus publicitaires des sites Web
En droit, la publicité intrusive relève de la concurrence déloyale
Identifier et poursuivre le bénéficiaire d'un détournement de revenus publicitaires
Publicité intrusive - Contre-mesures

Technologie de la publicité intrusive
Smart Links

Autres nommages de la technologie de publicités intrusives
Publicité contextuelle in-text
Publicité in-stream
Publicité in-text
Publicité dans le texte
Publicité textuelle
Vidéo contextuelle in-text

Classification de ces malveillances
Thiefware

Autres nommages de ces parasites
Adware intrusif
Foistware
Parasiteware
Pirateware
Scumware
Stealware

Quelques exemples d'opérateurs de publicité intrusive
InfoLinks (InfoLinks) (actif))
Related Info - Related Links - (Alexa) (archive)
CoolWebSearch (CoolWebSearch) (archive)
eWallet (Gator / Claria) (archive)
Precision Time (Gator / Claria) (archive)
Date Manager (Gator / Claria) (archive)
Gain (Gator / Claria) (archive)
OfferCompagnon (Gator / Claria) (archive)

Quelques exemples d'opérations
ContextPro (eZula) (archive)
HotText (eZula) (archive)
TopText (eZula Top Text) (archive)
iLookup (eZula) (archive)
IntelliTXT (Vibrant Media) (actif)
IntelliTXT Video (Vibrant Media) (actif)
SmartAD (Vibrant Media) (actif)
Smart Tags (Microsoft) (archive)
Surf+ (filemix.net) (archive)
Spedia Surf+ (Spedia.net) (archive)
ThirdVoice (ThirdVoice, Inc) (archive)
FlySwat (FlySwat) (archive)
PosiTexte (click4france) (actif ?)
ClickInText (ClickInText) (actif)
QuickClick (MBCi) (archive)
Smart Cursors (Commet Cursor) (archive)
BetterSurf (BetterSurf) (actif)
TopSearch (AltNet) (archive)
BargainBuddy (eXact Advertising) (archive)
BonziBuddy (Bonzi.com) (archive)
Superbar (Gigatech Superbar) (archive)

Très proche de la publicité intrusive
Cybersquatting
Spamdexing
Spamdexing - Google pris à son propre spamdexing


Ailleurs dans Assiste et sur le Web Ailleurs dans Assiste et sur le Web Ailleurs dans Assiste et sur le Web Spamdexing : manipuler la pertinence des moteurs de recherche

  1. #Spamdexing#