Artikelformat

Wie schädlich sind Content Scraper?

Da sich gerade einige über Content Scraper Seiten aufregt haben, hab ich mir die Frage gestellt wie gefährlich solche Seiten wirklich sind.

Gute Scraper

Gehen wir mal vom Normalfall aus: Der Inhalt meiner Website taucht in einer Suchmaschine oder mein Feed in einem Newsportal auf (sowohl die Suchmaschine als auch die News Seite sind reine Scraper ohne wirklichen Nutzen!). Ich bekomme einen sauberen Link und Google erkennt, dass ich die Quelle bin. Konsequenzen: Linkpop +1

Böse Scraper

Dann gibt es auch noch die Scraper von denen ich keinen Link bekomme. Ist meine Seite schwach und der Scraper stark könnte er sich in den SERP vor mit platzieren und ich verschwinde wegen Duplicate Content.

Gedankenspiele: Ist Google wirklich so dumm?

  • Idee 1: Wenn 99 % der Inhalte einer Seite Duplicate Content sind, es also inhaltliche Überschneidungen mit vielen anderen Websites gibt, muss es ein Scraper sein! Problem: Seiten wie der Spiegel oder Heise werden häufig auf hunderten von Foren und Blogs zitiert, dafür darf man sie als Quelle nicht abstrafen.
  • Idee 2: Wenn auf Seite A der Content x und auf Seite B der Content x + y vorhanden ist muss B das Original sein und A der Scraper, denn ein Scraper klaut häufig nur einen Teil der Inhalte (x). Problem: Es ist genauso gut möglich, dass A das Original ist und B nur einen Fullquote von A gemacht und diesen dann diskutiert hat.
  • Idee 3: Wer zu erst kommt malt zuerst, der bei dem ich den Inhalt zu erst finde ist der wahre Urheber. Problem: Eine News-Aggregator bekommt im Minutentakt neue Inhalte, wird vom Betreiber mit vielen Backlinks versorgt und verschickt vielleicht sogar Trackbacks an seine Quellen (noch mehr Backlinks). Dies sind zwei Argumente hier häufiger zu spidern als den Blog von Lieschen Müller deren Inhalte der Aggregator vielleicht stibitzt.

Du siehst, es ist schwer einen Scraper einwandfrei zu indizieren. Wer eine eindeutige Lösung hat möge sich bei mir (oder direkt bei Google) melden.


Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.