Blog referencement et moteurs
Bienvenue sur le blog de PR Weaver, le logiciel d'analyse du PageRank et des backlinks, développé par Agent Web Ranking, WebRankInfo (Olivier Duffez) et Stats Reports.
Vous y trouverez des informations sur le logiciel et l'actualité du référencement et des moteurs de recherche.

Aller au contenu | Aller au menu | Aller à la recherche | Qui sommes-nous ?

Formation sur le référencement naturel

vendredi 31 décembre 2004

Le "sandbox effect" sur Google

Saviez-vous que Google gérait un bac à sable ? C'est en tout cas le terme utilisé par les anglo-saxons (sandbox) pour désigner une nouvelle forme de filtrage ou de pénalité qui touche des sites sur Google.

Rien n'est vraiment confirmé, comme nous allons le voir dans cet article, mais le nombre de cas observés est suffisamment important pour prendre l'affaire au sérieux. Le sandbox est une forme de pénalité qui semble toucher les nouveaux sites sur Google. Alors qu'ils n'ont pas de problème particulier à être indexés, il est difficile de bien les positionner pour des expressions qui ne semblent pas hors de portée. Il semblerait que Google pénalise ces nouveaux sites pendant plusieurs semaines ou mois, le temps sans doute qu'ils fassent leur preuve, puis quand la quarantaine est terminée les sites gagnent soudainement beaucoup de places dans Google alors qu'aucune optimisation n'a été effectuée.

Cet effet a été identifié depuis début 2004 ; d'après mes recherches ce type de pénalité a été perçu suite aux Google Dance Florida et Austin, sans que l'on puisse pour autant associer de façon certaine les changements de l'algorithme qui en ont découlé et cet effet sandbox. Le terme aurait été inventé sur le forum SEO Chat (lire cette discussion du 26 avril 2004 qui aborde concrètement le problème pour la première fois). Cette discussion fait référence à d'autres discussions qui auraient eu lieu sur d'autres forums longtemps avant mais je n'ai pas pu les retrouver...

Il n'existe aucune certitude sur les détails de l'effet sandbox, juste une série d'hypothèses que je vais tenter de vous résumer.

L'effet sandbox s'applique-t-il à tous les sites ? Sans doute que oui, mais certains sites ne cherchent pas à se positionner pour des termes compétitifs, seulement des niches, donc ils ne s'en rendent pas forcément compte. Pour ma part je ne crois pas à un algorithme qui toucherait seulement certains sites ou certaines requêtes. Par contre l'effet peut sembler plus fort dans des domaines fortement concurrentiels. Cela touche aussi bien des sites ayant 10 pages que des sites ayant des milliers de pages. Le fait d'être inscrit dans DMOZ ne semble pas avoir d'influence.

Sur quels critères Google se base-t-il pour infliger cette pénalité ? Cela semble toucher tout nouveau site. L'ancienneté d'un site devient donc un critère qui compte... Ce n'est pas dur pour Google de déterminer la date de première indexation associée à un site. Nombreux sont ceux qui pensent que la pénalité ne s'applique pas au site directement, mais aux backlinks de ce site qui ne seraient pris en compte que très tardivement par Google. Certains ont pensé que les nouveaux sites qui bénéficiaient dès leur mise en ligne de centaines ou milliers de backlinks seraient sanctionnés, cette popularité ne semblant pas assez naturelle aux yeux de Google. Enfin il est possible aussi que l'origine des backlinks soit prise en compte (tout comme dans l'algorithme général de Google d'ailleurs) : nombre de sites différents faisant des liens, adresses IP et classes C de ces sites, schémas d'interconnexion, etc.

Combien de temps dure l'effet sandbox ? De quelques semaines à 6 mois en général, mais il est assez difficile de savoir si un site est concerné par cet effet. Vous pouvez toujours tester cet outil qui est sorti le 20 décembre et qui s'améliore de jour en jour semble-t-il.

On en sort en combien de temps ? Certains ont remarqué une sortie brutale mais encore une fois il est très difficile de répondre à cette question.

Bien entendu, Google n'a jamais rien voulu dire à ce sujet, encore moins que d'habitude. Comment peut-on expliquer l'intérêt pour Google d'un tel procédé ? Google attendrait un certain temps avant de prendre en compte des backlinks. Le nouveau site qui obtient des backlinks devrait donc attendre cette période avant de profiter de ces backlinks (en terme de PageRank mais surtout en terme de positionnement. Peut-être que Google a mis en place ce filtre pour lutter contre la vente de liens et de PageRank ?

Et si le sandbox n'était pas une règle simplissime ajoutée par Google à son algorithme ? Le sandbox toucherait tous les sites, pour toutes les requêtes, pendant la même durée, tout simplement pour limiter la chasse aux backlinks et surtout les achats de liens et de PageRank. Le fait que Google ne mette presque plus à jour l'affichage du PR sur la toolbar (même chose pour les liens fournis par la commande link:URL) va dans le même sens... Certains pensent que le sandbox ne s'applique pas à leur site, ou qu'il y sont resté seulement 1 mois, mais comment le savoir vraiment, surtout si on ne vérifie pas le positionnement de son site pour tous types de requêtes (y compris très concurrentielles) ? Logiciel pour vérifier et suivre le positionnement de son site

Remarque : il existe une autre définition du terme sandbox (plus ancienne), qui n'a pas grand chose à voir avec celle-ci : il s'agit d'une zone utilisée pour le développement d'un site ou d'une application ou les développeurs peuvent faire des tests sur une version spéciale du logiciel ou du site. Par exemple PayPal propose une zone de sandbox dans laquelle les webmasters peuvent simuler un achat en ligne sans qu'aucune transaction ne soit réellement effectuée. De la même manière, les wikis possèdent souvent un sandbox dans lequel les utilisateurs peuvent éditer des pages pour tester "comment ça marche".

Discussion

Pour en savoir plus et partager votre expérience, je vous invite à rejoindre les discussions sur le forum Web Rank Info :

D'autres hypothèses y sont avancées, à vous de vous faire votre propre opinion !

mardi 21 décembre 2004

Cindy McCaffrey quitte Google

Cindy McCaffrey, vice-présidente Communication de Google, quitte la société. C'est le premier cadre dirigeant à quitter Google depuis l'introduction en bourse de cet été.

Cindy McCaffrey a travaillé 20 ans dans les relations publiques, notamment pour Apple, E*Trade et 3DO. Ayant travaillé 5 ans chez Google, ses actions devraient lui permettre de ne pas avoir besoin de travailler, ce qui semble être le cas d'après SiliconBeat.

Voici une description plus précise de Cindy McCaffrey fournie par Google France :

Cindy McCaffrey est responsable des communications de l'entreprise et du marketing des produits et services Google destinés aux entreprises et aux consommateurs. La notoriété de Google est en grande partie due aux efforts déployés par Mme McCaffrey pour diffuser des informations sur la société par le biais de relations publiques et d'opérations de marketing ciblées plutôt qu'à coup de dépenses somptuaires de publicité ou de promotion.

Mme McCaffrey a plus de 20 ans d'expérience dans de nombreux domaines : relations publiques, relations avec les investisseurs, communication de marketing, communication avec les clients et avec les employés, diffusion de l'information, etc. Avant de rejoindre Google, Mme McCaffrey a été responsable des activités de communication d'entreprise sur le plan national et international pour les plus grandes entreprises de la Silicon Valley, dont Apple, E*TRADE, The 3DO Company et SmartForce (anciennement "CBT Systems").

Mme McCaffrey est titulaire d'un BA (Bachelor of Arts, 4 années d'études) de journalisme de l'université du Nebraska, et elle a suivi des études supérieures de littérature américaine à l'université du Missouri. Elle a commencé sa carrière comme journaliste et rédactrice pour plusieurs quotidiens régionaux des États-Unis et pour des publications spécialisées dans l'informatique et les technologies de pointe, en particulier Macintosh Today.

googlereviews.fr, googleshoppinglist.fr ...

Le JDN nous indique que Google vient de déposer des nouveaux noms de domaine :

  • googlereviews.fr
  • googleshoppinglist.fr
  • googlesuggest.fr
  • googlewishlist.fr
  • schoogle.fr

vendredi 10 décembre 2004

Google ouvre discrètement un data center en Géorgie

Data center de Google en Géorgie, comté de DouglasSécurité oblige, l'ouverture d'un nouveau data center est toujours très discrète. C'était sans compter les journalistes toujours à l'affut d'un scoop, comme Walter Woods (Atlanta Journal-Constitution) qui a mené son enquête...

Google a réussi à ouvrir un nouveau (?) data center dans le comté de Douglas en Géorgie sans que personne (ou presque) ne soit au courant. Pourtant pas moins de 100 personnes y travailleraient ! Le batiment (sans fenêtres) est situé dans une zone industrielle du comté de Douglas. Aucun nom, aucune enseigne, une seule porte d'entrée (fermée) avec du verre teinté... Difficile de deviner qu'une entreprise telle que Google vient de s'y installer.

Pour en avoir le coeur net, le journaliste Walter Woods s'est rendu sur place (une vidéo est disponible après inscription sur le site ajc.com). Malheureusement l'accueil fut assez glacial et il ne put même pas se faire confirmer qu'il se trouvait bien chez Google...

D'après un autre journal local, Google aurait investi pas moins de 300 millions de dollars dans ce centre de données. Ce centre aurait été construit en 1999 pour Exodus, une entreprise de la bulle Internet qui n'existe plus actuellement.

Source : Atlanta Journal-Constitution

D'après le journal Atlanta Business Chronicle, Google possède (aussi ?) un centre de données depuis 2003 à Riverside, dans ce même comté de Douglas.

Google Suggest Beta

Google SuggestGoogle Suggest est le dernier né des outils proposés par Google

Cet outil vous propose en temps réel une liste de 10 mots ou expressions se rapprochant de votre recherche. Cet outil affiche également en face de chacun des mots ou expressions le nombre de résultats. A vous ensuite de sélectionner dans la liste le mot et d'effectuer la recherche sur Google. A chaque fois que vous tapez une lettre de plus, la liste est modifiée.

Google Suggest semble être un outil hybride à mi-chemin entre les générateurs de mots ou expressions connexes du type AOL.fr (Exalead) ou Altavista (related searches) et les générateurs de mots clés proposés par Overture et Espotting (basés sur les statistiques des requêtes des utilisateurs). Le classement des expressions n'est ni alphabétique, ni fonction du nombre de mots, peut-être lié à la fréquence des requêtes sur Google, ce qui rendrait cet outil vraiment très intéressant...

Un filtre parental est inclus pour éviter la suggestion de mots "adultes".

Même si l'interface est disponible en français, Google Suggest indique que son outil n'est pas encore disponible dans d'autres langues que l'anglais. Peut-être parlent-ils de la FAQ car nos tests ont montré que Google Suggest fonctionne bien en français (avec les accents), en italien, etc.

Google Suggest

La vitesse de cet outil est assez surprenante. En effet, Google Suggest dialogue avec les serveurs de Google pendant que l'internaute tape sa requête et met à jour l'affichage sans nécessiter un rechargement de la page. Google avait déjà travaillé avec ce type de technologie (RPC) en développant Gmail.

Depuis le logiciel Agent Web Ranking vous pouvez accéder directement à Google Suggest et aux différents générateurs de mots clés directement depuis l'interface du logiciel.

Via Zorgloob

mardi 7 décembre 2004

Les moteurs tiennent-ils comptent des mots dans les URL ?

Vous vous êtes forcément déjà posé la question "Faut-il choisir les noms des fichiers et des répertoires de mon site minutieusement pour y placer des mots-clés ?". La réponse n'est jamais très claire, surtout dans les forums où chacun donne son avis. Il nous a semblé efficace et preuve de sérieux de faire un test rigoureux pour savoir une fois pour toutes si les moteurs de recherche prennent en compte les noms des fichiers dans leur algorithme de pertinence. Voici donc notre démarche et nos résultats...

Démarche

Comme pour tout test de ce genre, il faut faire bien attention à ne pas faire intervenir plusieurs facteurs de l'algorithme du moteur de recherche, et au contraire à se focaliser sur un seul, celui qui fait l'objet de notre test. Nous avons donc choisi de créer des pages toutes nouvelles, ayant les mêmes caractéristiques que d'autres pages du site, mis à part le nom du fichier ou du répertoire.

Pour cela, nous avons utilisé le "mot" rkpatjfg qui était absent des index des moteurs de recherche étudiés. Ce mot a été utilisé comme nom de fichier et dans certains cas comme nom de répertoire. Par contre ce mot est absent des pages de test créées.

Ces pages de test ont été indexées par certains moteurs grâce à des liens pointant vers elles à partir d'autres pages déjà indexées. Ces liens étaient au format texte mais bien entendu le texte du lien ne contenait pas le mot rkpatjfg.

Pour terminer ce test, une fois les pages en ligne et les liens pointant vers elles ajoutés, il suffisait de vérifier si ces pages étaient trouvables en faisant une recherche constituée du mot rkpatjfg uniquement. Ce terme n'apparaissant que dans l'URL des pages de test, il est clair et net que les moteurs qui retournent ces pages en tant que résultats prennent en compte les mots dans les URL.

Résultats

Voici les premiers résultats de nos tests, après plusieurs semaines d'attente.

  • Google, MSN (beta), Yahoo! et Exalead (utilisé sur AOL.fr) ont bien indexé nos pages de tests et prennent en compte les mots-clés dans les URL.
  • Les autres moteurs analysés (Ask Jeeves, Lycos, Teoma, WiseNut, Exalead, Voila) n'ont pas encore indexé les pages de test, donc nous ne pouvons pas encore conclure.

Google  MSN Beta  Yahoo  Exalead (utilisé sur AOL.fr)

Nous avons regroupé tous les résultats détaillés dans un rapport de positionnement généré par le logiciel Agent Web Ranking

Conclusions

Ce test montre de manière irréfutable (à nos yeux) que Google, MSN (Beta), Yahoo! et Exalead tiennent compte de la présence des mots dans les URL. Ce critère est-il important ou insignifiant ? Ce test n'a pas la prétention d'apporter de réponse à cette question plus complexe... à vous de réfléchir. Par contre si vous vous rappelez bien un test précédent concernant les tirets et les underscores, vous comprendrez que ceux qui ont choisi de mettre des mots-clés dans leurs URL séparés par des tirets ont peut-être un avantage sur les autres...

Remarque : les moteurs non listés ici ont été plus lents que Google, MSN beta, Yahoo! et Exalead à indexer nos pages (pas d'indexation après 1 mois...) mais nous vous tiendrons au courant bien entendu.

Articles, outils et ressources utilisés pour cette analyse

Discussions

Nous vous invitons à discuter de ce test dans le forum Web Rank Info : Le poids des mots, le choc des URL :-)

English version: Should You Use Targeted Keywords in URL?

Google facilite l'optimisation des performances AdSense page par page

Google AdSenseEn plus d'avoir légèrement modifié l'aspect de sa page d'accueil AdSense, Google vient de mettre à disposition des éditeurs affiliés AdSense une nouvelle fonctionnalité appelée "Critères d'URL" qui permet de faciliter l'analyse statistiques des performances des publicités. En effet il est (enfin) possible d'avoir des rapports détaillés par site, répertoire ou même par page et donc d'optimiser le rendement des publicités en comprenant mieux lesquelles sont les plus performantes.

Google avait déjà fait un premier pas dans l'analyse détaillée des statistiques en proposant les critères personnalisés (appelés auparavant tout simplement "critères"). Chaque éditeur peut en définir désormais jusqu'à 60 pour les publicités AdSense pour le contenu, ainsi que 50 pour les publicités AdSense pour la recherche.

Voici les explications détaillées de Google :

Que sont les critères d'analyse détaillée ?

Les critères d'analyse détaillée vous permettent d'afficher des rapports détaillés sur les performances de vos pages. En associant un critère d'analyse détaillée à une combinaison de pages, vous pouvez réaliser le suivi de diverses valeurs sur vos sites. Vous pouvez ainsi réaliser le suivi des performances des annonces au format leaderboard par rapport à celles des annonces disposées verticalement ou encore comparer les pages consacrées aux motos à celles consacrées aux voitures. Il vous faudra juste associer chaque groupe de pages concerné à un critère pour comparer les résultats dans vos rapports d'analyse détaillée. Il est également possible d'associer un critère d'analyse détaillée à chacun de vos domaines en vue de déterminer l'origine des clics.

Vous avez le choix entre deux types de critères d'analyse détaillée : les critères d'URL et les critères personnalisés.

Critères d'URL

Les Critères d'URL permettent d'effectuer le suivi des performances sans modifier le code de format des annonces. Vous pouvez ainsi commencer à suivre les performances de vos pages en entrant une URL partielle ou complète. Vous pouvez indiquer un nom de domaine de niveau supérieur afin de réaliser le suivi de toutes les pages de ce domaine ou entrer une URL partielle pour analyser toutes les pages figurant dans un répertoire donné. Entrez une URL complète pour suivre les performances de la page correspondante uniquement.

Les critères d'URL sont disponibles uniquement pour le programme AdSense pour les pages de contenu. Pour réaliser le suivi des performances d'AdSense pour les recherches, vous devez faire appel aux critères personnalisés.

Critères personnalisés

Les Critères personnalisés permettent d'effectuer le suivi des performances à partir des informations indiquées. Il vous suffit de coller dans les pages qui vous intéressent un code d'annonce correspondant à un critère d'analyse détaillée pour réaliser le suivi d'un ensemble d'URL. Utilisez les critères personnalisés pour effectuer le suivi des performances de différents formats d'annonces, par exemple, ou encore pour comparer différentes rubriques les unes avec les autres.

Chaque éditeur peut définir jusqu'à 60 critères d'analyse détaillée AdSense et 50 critères d'analyse détaillée AdSense pour les recherches. Ces critères permettent de déterminer dans quelle mesure les performances d'un site peuvent être optimisées. Les procédures d'ajout, de désactivation et d'attribution d'un nouveau nom aux critères d'analyse détaillée sont très simples, tout comme la génération de rapports personnalisés.

Vous pouvez discuter de ces nouveautés dans le forum Web Rank Info : Nouvelle interface AdSense et stats détaillées par URL

mercredi 1 décembre 2004

Nouvelle version de la barre d'outils de Google (2.0.114-8)

Google vient de sortir une nouvelle version de sa barre d'outils (v.2.0.114-8). Qu'y a-t-il de nouveau, mystère ? Peut-être encore l'algorithme du checksum ?