Blog referencement et moteurs
Bienvenue sur le blog de PR Weaver, le logiciel d'analyse du PageRank et des backlinks, développé par Agent Web Ranking, WebRankInfo (Olivier Duffez) et Stats Reports.
Vous y trouverez des informations sur le logiciel et l'actualité du référencement et des moteurs de recherche.

Aller au contenu | Aller au menu | Aller à la recherche | Qui sommes-nous ?

Formation sur le référencement naturel

mardi 31 mai 2011

Forum WebRankInfo (Olivier Duffez) : le must !

Présentation du forum WebRankInfo, spécialisé sur le référencement et le webmarketing, créé par Olivier Duffez (consultant indépendant en référencement).

lire la suite

mercredi 17 janvier 2007

Champagne : les sites les mieux placés sur Google

L'équipe de Ranking Metrics vient de publier une étude des sites ayant la plus forte visibilité sur les moteurs de recherche français dans le secteur du champagne. Plus que le cas particulier du champagne, c'est la méthodologie présentée qui pourra intéresser les lecteurs du blog PR Weaver. En effet, l'article présente de façon pédagogique un protocole d'analyse du référencement : du secteur dans son ensemble (quels sont les sites les mieux référencés ? s'agit-il des acteurs économiques classiques ou bien de pure players sur Internet ?) et d'un site en particulier (Vinatis), qui a été retenu pour une analyse plus détaillée.

Un complément sera prochainement publié, tandis que d'autres détails seront présentés pendant les prochaines formations proposées par Ranking Metrics.

mardi 29 mars 2005

Contrer une redirection 302 intempestive...

Quelques pistes pour venir à bout des détournements de page par redirection 302, un fléau qui touche de nombreux sites sur Google.

Comme vous le savez peut-être, contrairement à ce que Google indique dans ses pages destinées aux webmasters, il est possible de causer du tort à un concurrent en pratiquant ce que les anglais appellent le page hijacking (détournement de page). En résumé, si vous faites une redirection 302 d'une page A vers une autre page B (d'un autre site), alors la page B risque de disparaître de l'index au profit de la page A. Pour plus de détails, lire les articles Le détournement de page par redirection et Les redirections sauvages. Voici enfin une solution...

Jusqu'à présent, aucune solution n'avait été trouvée pour lutter contre cette nouvelle forme de spam (car le problème est que certains spammeurs utilisent cette technique consciemment, contrairement à certains annuaires qui ignorent qu'ils font du tort avec leurs redirections). Il n'y avait donc pas d'autre solution que de contacter la personne ayant fait la redirection (par exemple le webmaster d'un annuaire) pour lui demander de la supprimer.

Un membre de WebmasterWorld a proposé il y a quelques temps une solution basée sur l'outil de suppression de pages de l'index de Google (décrit ici). Cet outil permet à tout webmaster de faire retirer une page de l'index de Google en quelques heures. Il suffit d'ajouter une balise meta robots "noindex" puis de remplir ce formulaire. Un robot de Google vérifie la présence du tag "noindex" et supprime la page.

Dans le cas de la lutte contre les redirections "sauvages", vous pouvez tout simplement indiquer l'URL de la redirection comme URL de page à supprimer, et le tour est joué !

Rendez-vous sur http://services.google.com/urlconsole/controller, créez un compte Google si vous n'en avez pas déjà. Une fois le formulaire de connexion validé, vous arrivez à une "console" vous proposant de supprimer divers éléments (une page web vous appartenant, un message que vous avez posté dans un groupe de discussions, etc.). Choisissez l'option "Suppression à l'aide de balises META" et indiquez comme URL celle qui vous passe devant dans les résultats de Google, et qui redirige vers votre page. Ca peut être une URL du type www.example.org/go.php?id=45121

En quelques heures, la page incriminée devrait avoir disparu. N'oubliez surtout pas de retirer la balise meta robots que vous avez ajoutée sur votre page, sinon elle ne sera plus du tout indexée elle non plus...

Une astuce pour trouver les pages qui vous font du tort : tapez allinurl:votre-site.com ou site:votre-site.com dans Google pour lister les pages qui vous passent devant. Pour être encore plus précis (chercher ceux qui causent du tort à une page en particulier), tapez site:votre-site.com "phrase extraite de votre page" (avec les guillemets).

Malheureusement, cette solution n'est pas miraculeuse. D'une part vous pourrez être confronté à des URL de redirection "exotiques" qui ne seront pas acceptées par l'outil de suppression de pages de Google. D'autre part, vous devrez sans doute attendre plusieurs jours (voire semaines, voire mois) que votre page retrouve son positionnement, car Google lui avait peut-être infligé une pénalité de "duplicate content" (alors que vous étiez innocent !) ; cette pénalité peut durer 3 mois d'après certains témoignages. Enfin, la procédure décrite ici est très lourde dès qu'il s'agit de supprimer plusieurs URL...

Rappelons pour finir que tout cela n'arriverait pas si tout le monde faisait des liens en dur au lieu de redirections à la noix. D'ailleurs si vous cherchez des bons liens en dur, inscrivez votre site dans l'annuaire WRI ou rédigez une définition dans le Dictionnaire des e-technologies...

Olivier Duffez, en campagne pour des liens en dur ;-)

Cet article fut publié initialement sur WRI sous le titre Comment contrer les (mauvaises) redirections 302

jeudi 24 mars 2005

Google utilise-t-il plusieurs algorithmes en même temps ?

C'est une hypothèse discutée en ce moment sur d'autres forums, notamment dans cette excellente discussion qui discute des très gros changements de positionnement qui viennent de survenir depuis moins de 48h (j'ouvre une parenthèse : personne n'en a parlé je crois, mais l'avez-vous remarqué ? Moi j'ai vu des pertes importantes sur des termes absolument pas concurrentiels, sans avoir rien changé ni sur le site, ni dans les liens vers le site).

D'abord, il faut savoir qu'il a été identifié que les différents data centers de Google ne renvoient pas les mêmes résultats (ça c'est habituel) mais de façon très "tranchée", à savoir qu'on peut définir des groupes (a priori 2) de DC, les DC d'un même groupe renvoyant à peu près le même genre de résultats.

Cette première info est à rapprocher de la découverte faite par Jean Véronis de la chute étonnante du nombre de résultats annoncés pour la requête "the". En réalité, un groupe de DC renvoie un nombre proche de 8 milliards, et un autre groupe renvoie un nombre autour de 3 milliards.

Pour Phil Craven (référenceur anglais), ce serait stupide de la part de Google de ne pas avoir le même index sur ces différents DC. Que la synchronisation mette du temps, OK, mais d'habitude ça se fait en quelques jours, et là les différences entre ces (2) groupes de DC subsistent.

Alors il devient logique de se demander si Google n'utilise pas un algorithme différent sur chaque groupe de DC. Pour tester les 2 algos (qui peuvent ne différer que par quelques réglages ou par l'ajout d'un seul filtre), quoi de mieux que de le tester grandeur nature ? 99% des internautes n'y voient que du feu, et les référenceurs sont bien embêtés pour comprendre la logique, à moins d'enquêter du côté de ces DC.

Je ne cherche pas à m'approprier ces idées intéressantes, je n'ai fait que retranscrire ce que j'ai pu lire, mais j'aimerais bien recueillir vos analyses. On en discute d'ailleurs dans le forum WRI...

Yagoort : un nouvel outil d'analyse de Google

YagoortYagoort (Yet Another Google Rank Test) est un nouveau site présentant déjà plusieurs outils d'analyse du référencement, particulièrement sur Google. Il a été développé par Zarlboro, un membre de WebRankInfo, qui a présenté ces outils dans le forum, et qui a su réagir rapidement ces derniers jours à toutes les suggestions qui lui ont été faites. Le résultat est là : un outil fort sympathique à utiliser.

Les rapports générés par Yagoort permettent d’analyser la qualité et l'évolution de l'indexation de votre site dans la base de données Google. Ces rapports sont obtenus en traitant de manière systématique toutes les pages de résultats Google obtenues par les commandes site: et link:.

Pour ne citer que les chiffres les plus intéressants, Yagoort permet de connaître :

  • La pertinence moyenne de votre site obtenu par le nombre de pages ignorées par Google quand le paramètre filter=1
  • L'age moyen du cache de vos pages et pour chaque date le nombre de pages mises en cache. Ces chiffres sont obtenus par Yagoort en récupérant la date de mise en cache éventuelle pour les 100 premiers résultats.
  • Le nombre de noms de domaines différents obtenus par la commande link:
  • Le PageRank moyen de vos 20 premiers Backlinks

Croisés avec les chiffres de RobotStats par exemple, Yagoort vous permet de savoir à quel point Google "apprécie" votre site. C'est un outil tout à fait complémentaires de ceux développés sur WebRankInfo au sein de MyWri. Bien sûr, comme toujours avec Google, il faut faire attention de na pas tirer des conclusions trop hâtives de ces chiffres.

Dans un avenir proche, des statistiques globales (comme le nombre moyen de pages et de liens par site, le % moyen de page que Google considère comme pertinents) seront calculés de manière régulière.

De même des statistiques ainsi que des graphiques permettront de connaître l’évolution dans le temps de l'indexation de chaque site.

Venez rejoindre les différentes discussions entamées au sujet de cet outil :

Et également :

jeudi 24 février 2005

Techniques pour éviter l'effet sandbox

Google Sandbox...Rappelons en quelques mots la nature du problème : ce qui est appelé l'effet sandbox est une sorte de pénalité infligée par Google aux nouveaux sites, qui les empêche d'être positionnés sur des termes concurrentiels pendant une période de quarantaine, qui peut durer plusieurs mois. Les sites concernés (tous sans doute) n'ont aucun problème d'indexation mais ils sont rarement visibles dans les résultats de recherche, ou bien à des places très reculées.

La question est donc : "est il possible d'anticiper l'effet sandbox ?"...

Voici quelques éléments extraits de la discussion sur WRI :

  • créer un site dès que le projet est lancé, même si le site n'est pas prêt
  • obtenir quelques bons backlinks vers ce site (surtout pas trop, et de préférence issus de sites de référence dans le domaine)
  • ne surtout pas changer le nom de domaine en cours
  • prévoir de faire des mises à jour régulières du contenu du site, sinon Google prendra l'habitude de ne pas venir l'indexer souvent
  • faire progresser doucement mais sûrement la popularité du site (obtention de backlinks)

La discussion sur le forum de WRI : Anticiper l'effet SANDBOX ?

Autres articles ou discussions :

L'attribut "title" des liens est-il pris en compte par les moteurs ?

Une discussion à propos de l'attribut title situé dans les liens est en cours dans le forum WRI : Attribut "title".

Rappelons que cet attribut peut être placé dans une balise a (un lien) de cette façon :

<a href="http://www.prweaver.fr/blog/" title="Blog Moteurs et référencement">notre blog</a>

Le texte contenu dans cet attribut s'affiche dans une bulle d'info quand on passe la souris au-dessus. La question est de savoir si cet attribut est pris en compte par les moteurs et notamment par Google. La discussion montre que les avis sont partagés, mais voici ce qu'il en ressort pour l'instant :

  • Il est parfois utile de renseigner le lien avec l'attribut "title" afin de mieux informer l'internaute, sans toutefois abuser.
  • Google lit l'attribut title (puisqu'on le retrouve dans la version en cache) mais il ne semble pas pris comme critère dans le référencement (des tests complémentaires sont prévus et seront publiés sur WRI)
  • Toutefois il pourrait être un élément qui intervient dans le Latent Semantic Indexing (LSI) de l'algo de Google

Et vous, qu'en pensez-vous ? N'hésitez pas à laisser vos commentaires ou à rejoindre la discussion sur WRI.

samedi 19 février 2005

Latent Semantic Indexing (LSI)

Google utilise-t-il les techniques de Latent Semantic Indexing? Lisez la dernière newsletter d'Axandra (en anglais) pour mieux comprendre comment Google pourrait bien accorder plus de poids aux notions de Latent Semantic Indexing (LSI) depuis la dernière mise à jour de son algorithme:

  • Qu'est-ce que "latent semantic indexing?" ?
  • Pourquoi est-ce important pour le référencement ?
  • Où peut-on trouver plus d'information au sujet de LSI ?

Voici un extrait de cette lettre :

Latent semantic indexing aide les moteurs de recherche à comprendre de quoi traite une page web. En gros, il faut comprendre qu'il n'est pas nécessaire de se focaliser sur un seul mot-clé quand on optimise des pages web et qu'on cherche à développer les backlinks.

Les pages de votre site sont certainement similaires (en terme des sujets abordés) et sont centrées sur un sujet donné, même si elles utilisent des mots différents. Voilà ce qu'il faut faire : utiliser des mots différents pour décrire un même sujet, utiliser des variations du mot ou des synonymes. Ceci aidera sans doute les moteurs de recherche à déterminer le sujet de votre site.

Pour ma part, je me demande si c'est vraiment utilisé par Google pour les pages en français. L'opérateur ~ par exemple ne fonctionne pas pour le français. Et vous, qu'en pensez-vous ? Je vous invite à en discuter dans le forum WRI dans la discussion Latent Semantic Indexing (LSI) dans l'algo de Google ou ici via les commentaires.

English version