So kannst du mit Scrapebox alle indexierten Seiten einer Webseite ermitteln

Es kommt ja relativ häufig vor (zumindest bei mir), dass man alle Seiten einer Webseite finden möchte die in Suchmaschinen indexiert sind.

Z. B. weil man überprüfen will wie viele der eigenen Unterseiten tatsächlich in Google indexiert sind, oder weil man als SEO bei einem Kunden überprüfen will ob alle Unterseiten korrekt indexiert sind. Oder auch weil man Blogs mit hohem Pagerank sucht, auf denen man kommentieren kann um einen Backlink zu erhalten.

In den meisten Suchmaschinen lassen sich alle indexierten Seiten einer Webseite mit der site: Funktion finden. Allerdings müsste man die gefundenen URLs dann einzeln mit der Hand in eine Excel Tabelle oder in ein Textfile kopieren, wenn man sie weiter verarbeiten wollen würde. Und grade bei Webseiten mit sehr vielen Unterseiten wäre das extrem aufwendig.
Viel einfacher geht es da mit Scrapebox.

Um alle indexierten Seiten einer Webseite mit Scrapebox zu finden geht man folgendermaßen vor:

Zuerst einmal schreibt man die URL von der man die indexierten Seiten finden möchte in den Scrapebox Harvester.
Danach fügt man die site: Funktion hinzu, in dem man einfach site: vor die URL schreibt. Wenn man mehrere URLs gleichzeitig abfragen wollte, könnte man anstatt einzeln vor jede URL site: zu schreiben auch die Merge Funktion von Scrapebox benutzen. Aber bei einer einzigen URL kann man das auch mal schnell per Hand erledigen.
Dann wählt man die Suchmaschinen aus, die man abfragen will. Je nachdem welche Suchmaschine man abfragen will, z. B. nur Google, oder nur Yahoo, oder alle die möglich sind, macht man dann einen Haken vor die jeweilige Suchmaschine und klickt auf Harvest.
Nach einer Weile hat Scrapebox dann alle indexierten Seiten gefunden und zeigt sie in der URLs Harvested Box an.
Wenn man mehrere Suchmaschinen abgefragt hat, sollte man noch auf Remove Duplicate URLs klicken um die ganzen doppelten URLs zu entfernen.
Nun hat man alle indexierten Seiten einer Webseite gefunden, kann sie abspeichern und mit der Sitemap abgleichen oder den Pagerank aller Seiten ermitteln, oder was auch immer man damit vorhat.

Bewerte diesen Artikel

21 Bewertung(en), durchschnittlich: 5,00 von 5

Schreibe einen Kommentar Antworten abbrechen