A la lecture de toutes ces polémiques sur les robots.txt ou pas … comme chez Sylvain par exemple
http://blog.axe-net.fr/bref-jai-change-mon-robots-txt/
bref, c’est quoi la méthode infaillible pour ne pas que google indexe une page ??
Parce que pour le coup ca m’interesse
- robots.txt
- balise robots
et on ne répond pas
- login mot de passe
- javascript
c’est juste pas envisageable …ou complètement inutile dans mon cas de figure
parce que la {pro|débutante|experte|baltringue|ou ce que vous voulez} que je suis est perdue …
A vot’ bon coeur
23 commentaires
le 22/02/2012 RDD
le 22/02/2012 SuperBenoit
et je peux prouver ce que j’avance, encoyer moi une page que j’encryte à superbenoit@live.fr et on fait l’essais XD
le 22/02/2012 Loiseau2nuit
le 22/02/2012 SuperBenoit
le 22/02/2012 Loiseau2nuit
le 22/02/2012 RDD
P.S. : Pardonne moi pour l’auto-promo sandrine
le 23/02/2012 Aurélien
– ne pas mettre son site en ligne
– htaccess
– robots.txt + meta noindex (lorsque le bot est de bonne humeur uniquement).
le 23/02/2012 Sandrine
le 23/02/2012 Sandrine
ca faisait longtemps que tu étais pas venu mettre un commentaire, je m’inquiétais
le 23/02/2012 Sandrine
Merci à vous de vos conseils, je ne manquerais pas de vous tenir au courant.
le 23/02/2012 Romain
le 24/02/2012 sandrine
Soit dit en passant effectivement ton prof a craqué mais ce n’est pas de ca dont je parle ici mais plutôt je rebondis sur “Google indexe des pages en noindex” et comme j’ai le cas en ce moment, je cherchais une solution “fiable” et qui corresponde aux attentes de l’intégralité d’une équipe …
le 24/02/2012 sylvain
Quand Google le respecte, c’est noindex.
Mais une fois fait, ne mettez pas un disallow dans le robots.txt parce que Google n’ira plus crawler la page et ne verra pas le noindex.
Voir une discussion à ce sujet ici :
http://www.google.com/support/forum/p/Webmasters/thread?tid=25f6db1c7f335b51&hl=en
il suffit que quelqu’un fasse un lien vers votre page pour que Google indexe, alors si ensuite vous lui dites de ne pas crawler dans le robots.txt et bien je le répète, il ne verra pas votre noindex.
Bon, ensuite, Google est un aspirateur qui indexe tout ce qu’il peut et qui respecte ce qui l’arrange.
le 24/02/2012 Antoine
Pour le reste, meta noindex ou robots.txt, même avis que les commentaires précédents, Matt Cutts a déjà publié une vidéo dans laquelle il disait que ça n’était pas toujours respecté.
le 29/02/2012 Songeur
Pour que google n’indexe pas une page : ne la publie pas !
le 2/03/2012 Sandrine
le 5/03/2012 cdillat
le 8/03/2012 Gael
“Disallow: /?s=”
Gael
le 8/03/2012 Loiseau2nuit
:Merci
le 10/03/2012 Alekseo
Je suis également d’avis que Google indexe tout ce que l’utilisateur lambda peut voir.
Donc, quant à moi la seule variante gagnante pour cacher son contenu est de transférer les pages nécessaires dans la partie du site fermée par login et mot de passe.
Bonnee journée à vous!
le 12/03/2012 Cerbere
Au pire il y a la balise qui fonctionne assez bien ^_^
le 13/03/2012 Arnaud
le 13/03/2012 RenardBlanc
De mon cotés, et en relisant les commentaires. Je préfère la méthode du Renardudezert qui pour un blog WordPress complexe et qui a besoin d’être indexé semble le meilleur compromis sans ce prendre la tête. Quoi que
Vais peut être aller faire le ménage sur mon robot et mon fichier .htaccess du coup