Même si, fidèle à ses habitudes de transparence, Google ne fait preuve d’aucune bonne volonté pour communiquer sur son système de filtrage des sites, il est avéré que beaucoup de sites sont placés dans les tréfonds de son index lors des premières semaines, voire les premiers mois, de leur existence. Ces sites sont alors exclus de la plupart des résultats de recherche et sont dits placés dans ce qu’on appelle la Google Sandbox.

Pourquoi existe-t-il une Google Sandbox?

Pour Google c’est vraisemblablement un moyen de lutter contre les “spam-sites” qui n’ont d’autre but que de déjouer le système d’indexation au détriment du contenu et donc de leurs visiteurs. Il est en effet assez simple de créer des sites remplis de mots-clés compétitifs devant permettre un bon positionnement dans l’index, de générer du traffic générant lui-même un revenu. Une fois découvert, un spam-site n’avait plus qu’à se déplacer et réitérer le procédé avec un autre nom de domaine.

Mon site n’est pas un spam-site, pourquoi est-il dans la Google Sandbox?

Puisque Google ne dévoile rien à son sujet, il n’y a que des observations et des points de vue forgés à partir d’expériences personnelles ou professionnelles (en particulier des spécialistes du référencement).

Je ne suis pas un spécialiste mais mon avis est que Google considère tout nouveau site comme étant un spam-site potentiel et qu’il doit faire ses preuves pour être indexé convenablement. De ce que j’ai pu observer, un nouveau site est indexé normalement lors des deux ou trois premières semaines puis peut être placé dans la Sandbox passé ce délai. Le fait qu’un site soit placé ou non dans la Sandbox n’est certainement pas aléatoire. Il me semble que le nombre de backlinks, et surtout leur qualité, est ce qui a le plus d’influence dans la “décision”.

Comment éviter la Sandbox ou comment en sortir?

Quand un site est dans la Sandbox, il y a de fortes chances qu’il y reste plusieurs mois. Toutefois, il existe quand même de “bonnes pratiques” et un contexte d’évolution d’un site qui ont certainement une influence sur le fait d’éviter la Sandbox, d’y entrer ou d’en sortir:

Effets positifs:

  • Un augmentation naturelle des backlinks, surtout de sites ayant un bon page rank
  • Des mises à jour régulières avec du contenu riche et de qualité
  • L’utilisation de techniques naturelles d’optimisation de site pour le référencement
  • Un hébergement de confiance reconnu comme tel
  • Le trafic

Effets négatifs:

  • L’utilisation de “mass link building” ou “link farms”
  • Le “duplicate content”
  • L’utilisation abusive de mots-clé et d’une manière générale le référencement abusif
  • Un hébergement habitué aux spam-sites

Quoiqu’il en soit, un nouveau site a de grandes chances de faire un tour dans la Sandbox s’il ne dispose pas dès son lancement du soutien via des backlinks de plusieurs sites à “l’autorité” avérée. Dans le cas contraire, il faut bien s’attendre à galérer entre 5 et 9 mois avant d’avoir un référencement convenable dans Google. Durant cette période, il peut s’avérer utile de concentrer ses efforts sur le contenu du site bien sûr, mais aussi sur d’autres moteurs de recherche tels que Yahoo ou MSN. Une petite campagne sur des régies publicitaires peut aussi avoir un impact très positif sur le trafic.

Il y a beaucoup d’opinions contradictoires sur la Google Sandbox. Son existence même est discutée. Son application sur les nouveaux sites l’est aussi. Il y a sans doute une part de psychose là-dedans. Néanmoins, Sandbox ou non, il me semble évident que les nouveaux sites sont soumis à un système de filtrage de la part de Google. Je l’ai déjà constaté avec certains de mes sites et notamment… ce blog qui, depuis quelques jours, ne reçoit plus aucun trafic de la par de google. Même une recherche “blog-ak.com” l’exclut des résultats :| Il n’est pas impossible que le lien “Blog A-K” du menu d’Anime-Kun soit mal interprété par Google. Bref, la patience est mère des vertus =}

Additious

5 commentaires à “La Google Sandbox ou comment Google pénalise les nouveaux sites”

  1. Certes Google mets des resultats dans un sandbox ou plutôt ce qu’on appelle des supplemental results. Pas certainment des sites en entiers mais des fois que ses posts/pages/articles qui ont des attributs comme le duplicate content.

    Si t’as un site nouveau, il est indispensable de le faire indexer grâce au webmaster tools, cela va te permettre de savoir qu’elles parties de ton site web que Google peut pas y accéder.

    Comme t’utilise Wordpress, il y a tas de techniques pour éviter le duplicate content car Wordpress en produisent tas.

    Il y a tas d’autres techniques SEO que tu peux appliquer pour recolter un bon pagerank et surtout être placer au top des SERP(search engine results)

    Excuse moi pour mes erreurs de typos, j’écris l’anglais mais j’apprends à m’ammeliorer dans le Français aussi :)

  2. Merci Hans =]
    J’utilise différentes techniques pour contrer le duplicate content, notamment le plugin Wordpress Duplicate Content Cure. J’avoue toutefois ne pas avoir pensé à tout dès le lancement du blog.
    Je persiste à dire que le lien vers le blog présent sur toutes les pages d’Anime-Kun (soit plusieurs milliers de pages) a dû paraître suspect pour Google.

  3. Bonjour,

    effet sandbox ou pas, j’ai pu constater qu’un de mes sites sur-optimisé pour l’un de mes clients sur des mots-cles tres concurrencés et tres cher en adword (moy:1.40€), ouvert debut avril 2007 et tres bien referencé des les 2/3 premieres semaines, disparaitre aux oubliettes jusqu’au… 7 septembre 2007, 6 mois jours pour jours, date a laquelle il a refait une reapparition fulgurante dans les pages google et toujours en top10 et ce pendant 2 jours puis rebelotte… re-sandbox (?) disparition totale (plus rien) … effet sandbox ou pas c’est bizarre.. j’avais 2000/3000 pages lues/jours pendant ces 2 jours… ok j’ai pas mal abusé sur les mot-clés mais je connais d’autres sites (pires au vue des sources) qui eux sont toujours en liste (top10) alors pourquoi, comment ??? mysteres…

    d’autres parts, comme je suis curieux et j’aime bien savoir le pourquoi du comment, je me suis amusé a creer 2 sites (totalement identiques - meta et contenu) hebergés sur 2 serveurs differents… un tres connus et l’autre beaucoup moins, les 2 ont ete installés et lancés le meme jours, et j’ai fortement joué sur les mots cles pour etre “backlister” … resultat : 1 sites totalement disparu (sur le serveur tres connu) et l’autre au top 10 de chacune des combinaisons et toujours pas de sandbox ou backlistage depuis 4 mois maintenant…. aurais-je trouver une solution anti-sandboxe sacrifier un site pour un autre mystere encore….

    pour ajouter et terminer, le site sandboxé pour mon fameux client, je lui en ai fait 4 pareils pour voir et 2 ont passes l’etape sandboxe…. 2 autres ressortiront peut etre un jour (6 mois en moyenne apparement)….

    rien n’est impossible mais ya forcement une “sandbox” chez google…

  4. You don’t really need or want that lifestyle, it might hurt y’all slowly more…….Just tell him you
    don’t wanna repeat something your not too proud of z7uas.

  5. thank you, man

Ajouter un commentaire