Artikelformat

WDF*P*IDF – Die neue Zauberformel für SEO-optimierte Texte

Wer in den letzten Wochen die Diskussionen in der SEO Szene verfolgt hat, ist gewiss der Formel WDF * P * IDF begegnet. Lange Zeit haben viele ihre Texte anhand der Keyworddichte optimiert, das ist jetzt out. Stattdessen wird nun die oben genannte Formel gepriesen und inzwischen gibt es sogar ein Plugin, mit dem man zumindest den WDF berechnen kann. Was genau diese Formel bedeutet und was das WDF Plugin kann, möchte ich hier zeigen.

Keyworddichte, WDF, IDF, P – Begriffserklärung

Für die Ermittlung der Keyworddichte KD (u,v) wird gezählt, wie oft das Keyword u in einem Dokument v vorkommt und diese Zahl durch die Anzahl aller Wörter im Dokument dividiert. Das Ganze dann mit 100 multipliziert, denn die Keyworddichte wird in Prozent angegeben.:

KD (u,v)=100*TF (u,v)/L (v)

KD (u, v) : Keyworddichte für das Keyword u im Dokument v
TF (u, v): Termfrequenz des Keywords u im Dokumemnt v
L (v): Anzahl aller Terme im untersuchten Dokument v

WDF steht für Within Document Frequency und ist eine Verbesserung der Keyworddichte. Im Grunde werden hier die gleichen Informationen verwendet aber gestaucht durch einen Logarithmus, wodurch die WDF im Vergleich zur Keyworddichte aussagekräftiger wird. Hier die Formel:

WDF (u,v)=log2 (TF (u,v) +1)/log2(L (v))

log2 ist der 2er-Logarithmus und von der +1 braucht man sich nicht verwirren lassen, die macht die Formel für alle Werte gültig. Der WDF ist umso größer, je häufiger ein Wort im Dokument vorkommt.

IDF ist die Inverse Dokumenthäufigkeit, also der Quotient aus der Anzahl aller Dokumente, die das Keywort enthalten und der Anzahl aller betrachteten Dokumente. Auch hier wird das Ganze logarithmiert:

IDF (u) = log2(1+N/F (u))

IDF (u): Inverse Dokumenthäufigkeit für das Keywort u
N: Anzahl aller betrachteten Dokumente
F (u): Anzahl aller Dokumente aus N, die das Keyword u enthalten

Bleibt noch der Term P zu erklären. P ist einfach ein Faktor, in der Mathematik fügt man gerne Faktoren hinzu, um noch ein bisschen Spielraum zu haben. Zu recht wird sich so mancher fragen: Wie wähle ich N und P? Darauf gibt es gar keine so einfache Antwort. N könnte die Gesamtmenge aller Dokumente sein, die Google indexiert hat aber auch nur eine Teilmenge davon. Bezüglich P und N gibt es noch viele Fragezeichen. Das wird dann eine schwierige Aufgabe der (SEO) Tool-Anbieter sein, diese mit mathematischen Verfahren richtig zu ermitteln.

Zurück nun zur gesamten Formel: der Wert, den sie liefert wird umso größer je häufiger das Keyword in dem untersuchten Dokument vorkommt und je seltener es in der Gesamtheit aller Dokumente auftaucht. Karl Kratz hat in seinem Artikel zum WDF eine Statistik veröffentlicht, die zeigt, dass WDF * P * IDF in vielen Fällen mit der Position der Seiten in den SERPs korreliert.

Man kann und sollte diese Formel natürlich auch auf alle Wörter in einem Dokument anwenden (die Stoppwörter lässt man hierbei weg) und erhält damit eine Beschreibung des Dokuments anhand der darin vorkommenden Wörter. Eric Kubitz nannte es so schön die DNA eines Dokuments.

Nun haben wir diese schöne Formel, die wesentlich besser geeignet ist für die Optimierung von Texten als die Keyworddichte. Sie nützt uns allerdings nichts, wenn wir sie nicht automatisiert berechnen können, denn von Hand werden wir das wohl kaum schaffen. Ein Tool zur Berechnung der gesamten Formel gibt es zumindest öffentlich zugänglich noch nicht, aber inzwischen ein Plugin vom Pixeldreher, welches den WDF berechnet. Was dieses Plugin genau kann, möchte ich hier vorstellen. Die Meinungen dazu sind sehr unterschiedlich, von “super” bis “gib’s lieber wieder zurück”.

Vollständig ist es erst, wenn auch IDF und P zur Verfügung stehen und die gesamte Formel berechnet werden kann. Aber wie schon oben erwähnt, sind P und IDF gar nicht so einfach zu bestimmen und das wäre eher etwas für die großen Tool-Anbieter, die auch die Ressourcen zur Verfügung haben, die man braucht für die Forschung auf diesem Gebiet.

Das WDF-Plugin von Pixeldreher

Das WDF Plugin von Pixeldreher kann man hier bei codecanyon* für 14$ erwerben. Es gibt dort auch ein Video dazu, welches die Funktionalität des Plugins erklärt. Wenn gekauft, also die zip-Datei entpacken und das Plugin hochladen. Einstellungen gibt es keine. Irgendwo im Dashboard findet ihr dann beim Bearbeiten eines Artikels einen Bereich “WDF Values from Content”. Da ist links eine Tabelle zu sehen mit den 10 häufigsten Wörtern und der zugehörigen Häufigkeit und dem WDF und rechts das Ganze grafisch dargestellt. Ihr seht hier im Bild die Anzeige für diesen Artikel. Meistens tauchen sehr viele Stoppwörter in der Anzeige auf. Es gibt aber eine Filtermöglichkeit: durch Komma getrennt gibt man in einem Feld die Wörter an, die angezeigt werden, wobei das WDF-Plugin dann alle Wörter anzeigt, die die angegebenen enthalten.

WDF Value

Die WDF-Werte für diesen Artikel mit dem Plugin von Pixeldreher

Ich würde mir wünschen, Zugriff auf die vollständige Wortliste zu haben und einen Filter, mit dem ich Wörter von der Anzeige ausschließen kann. Denn so könnte man die häufig vorkommenden Stoppwörter und sonstige irrelevante Begriffe ausschließen und würde vielleicht andere für den Artikel interessante Begriffe entdecken. Mit dem Hintergrund, dass ich so wie man es mit der Keyworddichte auch macht, die Bestplatzierten analysiere und meinen Artikel daran anpasse. Klar, es fehlen IDF und P aber dennoch kann man mit dem Plugin etwas anfangen, wenn noch ein paar Verbesserungen hinzukommen.

Ich habe mal auf diese Weise einen Artikel von mir analysiert und diesen einfach nur etwas an einen der Top-Platzierten angepasst. Mir eigentlich gar nicht viel Arbeit gemacht. Der Artikel rankte am 15.11 auf Platz 59, heute am 20.11 auf Platz 23. Allzu viel will ich da nicht reininterpretieren, denn es könnte auch der Freshnessbonus gewesen sein. Ich werde auf jeden Fall noch ein paar Experimente machen und sehen, was geschieht.

Man sollte auch nicht vergessen, dass es ja auch noch vielleicht hundert andere Rankingfaktoren gibt, aber wie Karl Kratz in seinem Artikel schon sagt, es gibt Keywörter für die WDF * P * IDF gut funktioniert und man gute Positionen auch ohne Linbuilding erreichen kann.

Ist die WDF * P * IDF-Formel neu? Nein ist sie nicht, in mehr oder weniger ähnlicher Form findet man diese auch in älteren Artikeln und Büchern, aber sie ist top-aktuell und lässt sich vielleicht gut verkaufen. Also macht mal ihr SEO-Tool-Anbieter 🙂

Wie sehr die Meinungen der SEOs zu diesem Thema auseinander gehen, sieht man sehr gut an diesem Artikel auf seo-united.de, in dem mehrere Experten zur “neuen Keyworddichte” befragt wurden.

Und inzwischen hat sich Karl Kratz nochmal über die Termgewichtung ausgelassen.


Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.