Je me suis rendue compte que les robots.txt, les balise robots et les liens en nofollow n’était pas si évident que cela à expliquer et à fortiori à comprendre.
Alors reprenons depuis le début
Toutes ces sales bêtes qui donnent du fil à retordre aux débutants sont là pour « communiquer » avec les moteurs de recherche. Ils vont leur indiquer ce qu’ils peuvent faire ou pas.
Nous ne reviendrons pas sur les polémique sur l’obéissance des moteurs de recherche … normalement ils écoutent mais comme nous ils ont des petits moments où ils n’en font qu’à leur tête
Comme cet article est destiné aux débutants, nous allons comparer notre site à une boite de nuit où vous voulez rentrer et nous allons considérer que VOUS êtes le moteur de recherche enfin son bot (son petit programme qui fouille partout)
Vous voilà donc devant la porte …
Le robots.txt
( le videur)
C’est lui qui va vous dire (donc dire aux moteurs ) si vous avez le droit d’entrée et ce que vous avez le droit de faire !
Dans certain cas (quand vous êtes tricard ou VIP, vous avez le droit à vos propres consignes)
user-agent: *
Disallow:
Les consignes sont pour tout le monde et C’est open bar !!!
(tous les bots peuvent indexer)
User-agent: *
Disallow: /
Rêvez pas c’est privé !
(interdiction pour tous les bots d’indexer quoi que ce soit !)
user-agent: googlebot
Disallow : /
Il est tricard
(le bot googlebot n’a pas le droit d’indexer)
Le vip Google peut bénéficier de son langage à lui n ne lui interdit pas on lui autorise … bref attention de ne pas vous emmeler les pinceaux et de faire une mixture des deux cela risque de se finir par un « rien n’est indexé »
Le videur peut aussi vous interdire certains endroits de la boite …
user-agent:*
Disallow: /derrierelecomptoir/
Vous pouvez entrer mais pas le droit d’aller derrière le comptoir
(tous les moteurs peuvent indexer sauf le répertoire « derrierelecomptoir » et son contenu)
la balise meta robots
(l’hôtesse qui gère à l’intérieur)
C’est elle qui va gérer espace par espace ce que vous pouvez faire à l’intérieur.
Considérez qu’une page est un carré vip
C’est donc elle, l’hôtesse qui va vous donnez les consignes devant chaque carré.
noindex, nofollow
Vous n’entrez pas et vous ne suivez pas les gens qui pourraient en sortir
(Aucun bot n’a le droit d’indexer ou de suivre les liens internes ou externes)
index,follow
c’est open bar, tout le monde entre et peut suivre tout le monde
(Tous les bots peuvent indexer et suivre les liens)
noindex, follow
Elle est un peu bizarre cette boite, vous n’avez pas le droit d’entrer dans le carré vip mais rien ne vous empêche de suivre ceux qui en sortent !
(les bots n’ont pas le droit d’indexer mais peuvent suivre les liens)
index, nofollow
Vous avez le droit de rentrer mais pas le droit de suivre quelqu’un …
(les bots peuvent indexer mais pas suivre les liens)
Précision
Si vous mettez un videur à la porte qui autorise tout à tout le monde et une hôtesse qui autorise tout à tout le monde, nous sommes donc d’accord que la seconde fait de la figuration !
Inutile donc d’ajouter une balise meta robots qui autorise l’indexation et de suivre les liens si votre robots autorise tout
le rel « nofollow »
Le bon copain qui prévient (ou la bonne copine) mais si ! Vous voyez, celui-qui vous chuchote dans l’oreille « non la suit pas, c’est pas une fille » ou celle-qui vous dit « non n’y va pas il a pas l’air net »
<a href="http://www.example.com" rel="nofollow">il est pas fréquentable</a>
En mettant l’attribut « nofollow » sur un lien vous déconseillez aux bots de le suivre
Précision
Si vous mettez une hôtesse qui interdit de suivre tout à tout le monde, nous sommes donc d’accord que les bons conseils du copain ou de la copine ne servent à rien, on vous l’a déjà dit !
Inutile donc d’ajouter un nofollow si la balise meta le précise déjà.
J’espère que cette petite promenade en boite vous aura éclairer sur le rôle de chacun.
Vous trouverez des vrais infos sur http://fr.wikipedia.org/wiki/Protocole_d’exclusion_des_robots, ou sur http://www.robotstxt.org/ (en), http://www.robotstxt.org/meta.html (en)
Allez je retourne danser …
36 commentaires
le 29/11/2011 Loiseau2nuit de Développeur web Angers
et les traces de chaussures sur le dancefloor, c’est quoi ? Des marqueurs UTM ?
#PasTaper #DejaDehors ^^
le 29/11/2011 Sandrine
non les utm c’est le tampon que l’on te colle sur le poignet
le 29/11/2011 Emile de Location Corse
Rhoo ouai mais non c’est compliqué pour moi… dans toute ma vie j’ai été en boite que 2 fois… une boite gay et une boite … heu… pas gaie du tout d’ailleurs…
le 29/11/2011 eThno de Course Hippique
Les images parlent d’elle même .
le 29/11/2011 Audrey de SEOgirly
Mais c’est tout bonnement génial !! j’adore ce style d’écriture – j’aimerais bien suivre tes cours de référencement si c’est comme ça !
le 29/11/2011 Etienne de lemmingseo2
On dirait bizarrement un cours que j’ai eu dernièrement, sauf que celui ci ressemble plus au « référencement pour les nuls ».
le 30/11/2011 Discodog de Rudy
Je veux plus d’illustrations comme pour « la balise meta robots » svp!
le 30/11/2011 Sandrine
J’aurais du la dédicacer ^^
le 30/11/2011 nitrix de societe hong kong
Je plussois bon je met plus jamais de videur…vive les hotesses
le 30/11/2011 RaphSEO de Sick submitter
C’est bizarre mais j’ai nettement plus peur de du robot.txt que de la méta robot avec tes illustrations
si non c’est simple clair et précis.
tu vas à l’essentiel et pour celui qui débute c’est parfait
le 30/11/2011 Vincent
T’as oublié de dire que Google était le fils du patron qui se tapait l’hôtesse, même si en fait c’est un homme.
En clair on a beau lui dire qu’il a pas le droit, s’il sent que la soirée est bonne il va vouloir rentrer quand même…
le 30/11/2011 Sandrine
oui, je sais … mais comme je veux rentrer la prochaine fois, je voulais pas dire du mal du fils du patron !
le 30/11/2011 Pink hat
Pourquoi l’hôtesse est un monsieur ?
le 30/11/2011 Vincent de Jambonbuzz
C’est le nofollow qui m’a dit ça
le 30/11/2011 Sandrine
c’est parce que c’est la boite d’un BH j’en sais rien, moi … on me demande de mettre des photos de filles à grosses poitrines, je m’execute … je suis dans une phase « gentille fille obéissante »
le 30/11/2011 IFDP, Nicolas
C’est pas vraiment un lieu que j’ai pour habitude de fréquenter, mais le : « non la suit pas, c’est pas une fille » m’a bien fait marrer
le 30/11/2011 aymeric de blog seo
non, ce commentaire n’est pas un spam… Tout simplement ingénieux ton article
et le « link rel=canonical »: euh mademoiselle, c’est mon pote qui essaye de te draguer en fait ^^
le 30/11/2011 Emmanuelle de orthodontie Paris
Bien frais tout ça, chouette !
Par contre _ suis pas blonde pour rien _ je ne suis pas sûre de bien comprendre ce que tu veux dire par :
« Le vip Google peut bénéficier de son langage à lui : on ne lui interdit pas on lui autorise … bref attention de ne pas vous emmêler les pinceaux et de faire une mixture des deux cela risque de se finir par un « rien n’est indexé » ».
Dans ton exemple en l’occurrence, tu lui interdis totalement l’accès…
Donc dans quel cas ce « langage perso » pourrait-il s’appliquer ?
le 30/11/2011 Sandrine
parce que quand tu fais un robots.txt via les outils pour webmaster la commande disallow devient Allow … et qu’il ne faut pas mélanger les deux !
le 30/11/2011 Emmanuelle de Numastick Web Factory
Tu m’étonnes John (jamais utilisé cette commande pour ma part, je préfère le faire chez moi, bien au chaud) !
Sinon, je m’inquiète un peu si tu es en mode « gentille fille obéissante » : c’est grave, ça, non ?
On peut faire quelque chose pour t’aider ?
le 30/11/2011 Emmanuelle de Numastick Web Factory
Heu…
En fait, le commentaire de Vincent « En clair on a beau lui dire qu’il a pas le droit, s’il sent que la soirée est bonne il va vouloir rentrer quand même… » répond à ma question.
Mais il n’était pas affiché au moment où je rédigeais, me tombe pas dessus !
le 30/11/2011 Renardudezert
Il parait que si tu te déguise en hôtesse tu passes facilement le videur.
Et que si ensuite tu te transforme en videur, tu emballes facilement l’hôtesse.
Je dis ça je dis rien, c’est un mec (GoogleBot pour être précis) qui m’a appris cette feinte.
Sinon, très bon article bien illustré en plus !!
le 30/11/2011 Youplix
J’adore!!
Les explications par analogie de la vie courante (si on considére qu’aller en boite en fait partie) ça marche toujours et on retiens plus facilement la leçon.
Bref, très bon article a (re)mettre entre toutes les mains!
le 30/11/2011 Installation panneaux solaires
Et voila, on ajoute quelques photos de nanas ayant une bonne capacité pulmonaire pour que les commentaires fusent de partout .
Un prochain article à propos de ce phénomène?
le 30/11/2011 Sylvain
Et la boisson est comprise ?
le 30/11/2011 Sandrine
@sylvain & @Cerbere: ca dépend de ce que tu as payé à l’entrée
le 30/11/2011 Allow, disallow, noindex, follow et autres sale bêtes … | Petites Réflexions sur le référencement |
[...] Allow, disallow, noindex, follow et autres sale bêtes … | Petites Réflexions su…
le 30/11/2011 soraya
Pas mal, mais quid du black hat ? tu representerais comment ?
le 30/11/2011 Sandrine
quid du blackhat? ca c’est une bonne question !
Le blackhat si c’est le proprio de la boite, il a donné des consignes à son videur, il fait entrer certains bots par une autre porte et ils arrivent dans une boite très belle, très propre où tout le monde est gentil (ip cloaking)
ou alors c’est le beau brun habillé tout en noir au bord de la piste , qui claque des doigts et qui repart avec la fille que tu tentais de draguer depuis des heures … et tu sais pas comment il a fait ^^
J’hésite en fait
EDIT
ou alors c’est celui qui te fait croire que sa superbe hôtesse est une fille alors qu’en fait non
le 30/11/2011 Cerbere de TasteMySeoJuice
On peux rentrer à la bouteille?
le 30/11/2011 Watussi
Si je peux me permettre :
Le disallow du robots.txt interdit les robots de crawler.
En aucun cas il n’interdit d’indexer.
Google indexe très régulièrement des pages interdites par robots.txt
le 1/12/2011 Sandrine
C’est ce que j’ai précisé en début d’article sur l’obéissance et en théorie , si il ne peut pas crawler, il ne devrait pas pouvoir indexer …mais Google c’est le fils du patron …;)
le 6/12/2011 agnes de actenciel
Super, j’ai enfin compris cette histoire de robots meta ou txt et leurs utilisations respectives et pourtant je ne suis pas blonde
le 9/12/2011 Sergent de Imprimerie Toulouse
Très clair et avec des images qui restent bien en tête : ) Un excellent moyen mémo téchnique. Merki Sandrine !
le 27/12/2011 davidredaction
Bonne idée d’utiliser l’analogie avec la boite de nuit, ludique et instructif comme article, merci beaucoup!
le 31/12/2011 Awomo Gérard
moi j’aime pas les boîtes de nuit!!!
je fais quoi?
Bise et bonnes fêtes Sandrine et merci encore pour tes enseignements.