Pour la migration d’un site Oscommerce vers Prestashop j’avais besoin de récupérer dans un fichier texte l’ensemble des pages du site que Google avait indexées. Matthieu Verne de Referenseo m’a donné une petite astuce que je partage avec vous ici.
Avant de débuter votre lecture, si vous souhaitez améliorer le SEO de votre boutique en ligne, téléchargez gratuitement notre livre blanc seo.
La première étape consiste à installer un bookmarklet sur votre navigateur.
Rendez-vous sur ce site puis faites glisser le bouton « Simple google results » dans votre barre d’outils.
Il faut ensuite taper l’url qui va nous sortir les pages connues par Google.
[/html]
« https://www.google.fr/search?q= » est l’url classique d’une recherche sur google.fr
« site: » est la commande permettant de trouver les pages d’un site donné.
« reussir-mon-ecommerce.fr » est le nom de domaine de mon site à remplacer par le vôtre.
« num=100 » permet de demander à google d’afficher 100 résultats par page (malheureusement il semblerait qu’il ne soit pas possible d’en afficher plus sur une seule page).
« start=0 » permet de définir la page à afficher, ici on demande la première.
Une fois cette url tapée vous allez vous retrouver avec 100 résultats qui correspondent aux pages de votre site que Google connaît. C’est bien mais ce n’est pas très pratique à utiliser, c’est là que le bookmarklet que vous avez précédemment installé intervient.
Cliquez sur le bouton « Simple Google results » dans votre barre des tâches, vous allez obtenir un fichier contenant uniquement les url de votre site.
Merci à Matthieu pour cette astuce.
Passionné d’e-commerce et de SEO, je suis le créateur du site reussir-mon-ecommerce.fr. Depuis plus de 15 années, j’aide les e-commerçants à développer sainement leur entreprise. Et si je ne suis pas devant mon écran, c’est que je suis derrière ma batterie à jouer du rock ! !
Et tu peux rajouter &filter=0 à ta requête pour avoir les résultats en index complémentaire.
Super merci pour l’info Magicyoyo ;)
Oui, sauf qu’il y a une différence de taille en utilisant ce bookmarklet et en faisant une requête de type « site: » dans Google. Ce code javascript date de 2009, ceci explique peut-être que l’outil affiche 5 fois moins de pages indexées qu’en cherchant directement. A améliorer ^^ Référenceurs, à vos éditeurs de texte :-)
@Julien je n’ai pas constaté ce problème tu aurais un exemple ?
Hello,
Cette manipulation semble convenir pour des site avec un faible volumes de pages indexé, lorsqu’il s’agit de plusieurs milliers de page ce n’est plus jouable.
Actuellement j’inspecte les différentes méthodes, mais ça reste très limité & aussi bridé volontairement de la part de Google (oui c’est les pire).
Merci pour l’info.
A bientôt !
Bon…
Je reviens sur cet article avec un autre billet qui concerne cette problématique :
http://www.webbax.ch/2015/02/20/analyser-son-referencement-avec-scrapebox/
A bientôt !