Website Boosting

Online verfügbar

Website Boosting

Editorial

WDF*P*IDF

Eine neue Formel bringt die SEO-Branche gehörig ins Grübeln. Genauer gesagt, ist sie im Information Retrieval eigentlich schon seit 1992 bekannt und wird dort benutzt, um die Relevanz von Dokumenten aus einem größeren Datenbestand bestimmen zu können. WDF steht für „Within-document Frequency“. Im Prinzip verbirgt sich dahinter nichts anderes, als die Keyword Density, also die Suchwortdichte eines Dokuments. Je häufiger ein Wort im Vergleich zu anderen Worten vorkommt, desto höher ist der Wert. Der Unterschied ist, dass mittels der Logarithmusfunktion die normale relative Häufigkeit im Wert gestaucht wird. Damit treten die Abstände der einzelnen Worthäufigkeiten deutlicher hervor. IDF ist die Abkürzung für die inverse Dokumenthäufigkeit (Inverse Document Frequency), die wiedergibt, wie hoch die Trennfähigkeit eines Begriffes im Zusammenhang mit anderen Dokumenten ist. Während also z. B. das Wort „Skalpell“ in Bezug auf das gesamte Web sicher eine hohe Trennschärfe hat, weil es in der Masse vergleichsweise in wenigen Dokumenten vorkommt, wäre es in einer Datenbank mit ausschließlich medizinischen Inhalten wohl weniger zur Relevanzbeurteilung geeignet, weil es dort in sehr vielen Texten vorhanden ist. P ist ein statistischer Korrekturfaktor.

In vereinfachten Worten ausgedrückt: Je häufiger ein Term in einem Dokument vorkommt und je größer der Abstand seiner Häufigkeit zu anderen Termen ist und in je weniger Dokumenten der Term so noch vorhanden ist, umso relevanter ist das Dokument. Der Vollständigkeit halber sei erwähnt, dass bei der Häufigkeit natürlich sinnigerweise bestimmte Grenzwerte zu setzen sind, sonst wäre z. B. ein Text mit ausschließlich diesem Term das beste Ergebnis – was natürlich wenig Sinn macht.

Ist es nicht das, was gute Suchmaschinenoptimierer beim Texten seit über zehn Jahren beachtet haben? Für die Hauptphrase (z. B. „Radiergummi online kaufen“) eine Keyworddichte von drei bis fünf Prozent zu justieren und darauf zu achten, dass die nächsten Wortphrasen möglichst unter einem Prozent bleiben? Und natürlich vorab zu prüfen, wie viele Treffer Google bei der Suche nach der Wortkombination in Anführungszeichen (als „exakt match“) liefert? Wenige Treffer bedeuteten, dass die Optimierung hierauf vergleichsweise einfach gelingen würde. Oder ist an dem Hype um die „neue“ Formel mehr dran, als man auf den ersten oder zweiten Blick erkennen kann?

Noch liegen außer den vielen Diskussionsbeiträgen auf einschlägigen Websites zu wenig wirklich belastbare Erkenntnisse dazu vor. Wir haben uns daher vorgenommen, diesem Thema in der nächsten Ausgabe zusammen mit dem SEO-Experten Karl Kratz, dem die Ehre gebührt, es in die Breite getragen zu haben, kritisch auf den Zahn zu fühlen.