Mehr Besucher dank WDF*IDF Analyse

WDF*IDF - TermgewichtungOk, der Titel klingt etwas reißerisch, aber eigentlich ist “wie bekomme ich mehr Besucher” doch immer ein Thema, und wie man genau in diese Richtung hinarbeiten kann und was WDF*IDF damit zutun hat, soll das Thema des nachfolgenden Artikels sein.

Wer in SEO-Kreisen unterwegs ist, dem dürfte “WDF*IDF” ein Begriff sein. Doch längst nicht jeder Webmaster oder Blogger ist firm in Sachen SEO. Ich wage sogar zu behaupten, dass die meisten das Thema WDF*IDF, wenn überhaupt nur vom “Hörensagen” kennen. Deshalb möchte ich erst einmal das grundlegende Verständnis für die Thematik schaffen und euch dann ein hilfreiches Tool vorstellen.

Wer in Sachen WDF*IDF bereits fit ist, überspringt die nächsten beiden Absätze einfach und skippt vor bis zur Toolvorstellung.

WDF*IDF ist kein Song von den Fantastischen Vier

Zwar könnte WDF*IDF auch gut aus dem Song MFG von den Fantatischen Vier stammen, jedoch handelt es sich hierbei, vereinfacht gesagt, um eine Formel zur Beschreibung der Güte eines Textes (durch die Berechnung des WDF*IDF für alle Terme des Textes).

Neben vielen anderen Faktoren wie z.B. der Domain, dem Inhalt (Qualität) der Seite und den sozialen Signalen, spielt auch die Termgewichtung eines Dokuments eine entscheidende Rolle, um eine gute Platzierung in den Suchergebnissen zu erzielen. Die Termgewichtung beschreibt, wie oft ein Term (Wort/Wortkombination) in einem Dokument vorkommt.

Früher wurde im Rahmen der Termgewichtung auf die Keyword-Dichte (Keyword-Density) gesetzt. Aufgrund mehrerer Überlegungen ist man davon aber ab und setzt mittlerweile auf die WDF*IDF-Formel, die aus dem Gebiet des Information Retrieval stammt und sich dort über Jahre etabliert hat. (Wer es genau wissen will, liest hier nach, warum die Keyword-Density Schwachsinn ist.)

Wie berechnet man WDF*IDF

Die komplette Herleitung und Implementierung der WDF*IDF-Formel möchte und kann ich an dieser Stelle nicht bieten. Dennoch möchte ich versuchen euch die grundlegende Idee hinter WDF*IDF näher zu bringen. Denn wenn man die Formel einigermaßen verstanden hat, erschließt sich einem auch besser wir man damit arbeiten kann.

WDFIDF - Erklärung und Erläuterung

Der grüne Teil der oben stehenden Grafik ist WDF, die Within Document Frequency. Rechts davon, neben dem Multiplikationszeichnen, befindet sich IDF, die Inverse Document Frequency. Links vom Gleichzeichen befindet sich das Ergebnis von WDF*IDF, die Termgewichtung.

Betrachten wir zuerst den WDF-Teil und lassen den Logarithmus einmal außer acht, dann steht dort “Häufigkeit des Terms i um Dokument j” geteilt durch die Anzahl aller Terme im Dokument, von der noch einmal das vorkommen des Terms abgezogen wird.

WDF berechnet also die Anzahl des Terms in einem Dokument im Verhältnis zu allen anderen Termen (die nicht der gesuchte Term sind). Hinzukommt noch der Logarithmus zur Basis 2, der der Natur unserer Sprache geschuldet ist. (In diesem Punkt vertraue ich einfach mal der Aussage von Herrn Kratz.)

Die IDF lässt sich berechnen, indem man die Vereinigungsmenge aller Resultate in einem Information Retrieval System (z.B. Datenbank) in denen der Term i vorkommt, durch die Anzahl aller Resultate in denen der Term i vorkommt, teilt, 1 hinzuaddiert und davon den Logarithmus zur Basis 10 nimmt.

Zum Verständnis ein praktisches Beispiel. Unser Dokument enthält den Text: “Ich brauche einen Job.” Der Term i, den wir auswerten wollen, sei “Job”. Das Information Retrieval System sei Google. Nun suchen wir in Google nach dem Begriff “Job” und erhalten 8 Treffer. Somit ist N(i) = 8. Um nun den Zähler im Bruch des IDF-Teils zu berechnen, fragen wir Google für alle Terme im Dokument. Für “Ich” erhalten wir 5 Treffer, für “brauche” erhalten wir 4 Treffer und für “einen” erhalten wir 6 Treffer. Nun addieren wir alle Suchergebnisse und entfernen doppelte Einträge. Dies wäre die Vereinigungsmenge.

Doch nun genug zur Theorie. In der Praxis berechnet man WDF*IDF natürlich nicht von Hand, sondern mit Hilfe von Tools bzw. Werkzeugen. Eines davon, welches zudem kostenlos ist, möchte ich euch nachfolgend vorstellen.

Kostenloser WDF*IDF-Helfer

Um in der Praxis mit WDF*IDF zu arbeiten, muss es nicht gleich das komplette Toolset für mehrere Hundert Euro pro Jahr sein. Eine gute Möglichkeit zur Arbeit mit WDF*IDF bieten zum Beispiel die Tools von wdfidf-tool.com. Derzeit gibt es dort zwei kostenlose Tools. Zum einen ein reines WDF*IDF-Analysetool und zum anderen ein WDF*IDF-Texteditor.

Das Analysetool erwartet ein Keyword und auf Wunsch noch eine Vergleichs-Url. Für den Artikel hier habe ich als Keyword einmal “Cloud Downloader” (mein eigenes Tool) und meinen Artikel zum Cloud Downloader ausgewählt.

WDFIDF Analyse  WDFIDF Analyse Übersicht  WDFIDF Analyse Wettbewerb

Als Ergebnis erhält man zum einen den Übersichts-Tab und zum anderen den Wettbewerbs-Tab. Der Übersichts-Tab zeigt die relevanten Keywords mit der stärksten Gewichtung sowohl als Grafik als auch in tabellarischer Form an. Zudem bietet die Tabelle den exakten WDF*IDF-Wert und ggf. den berechnetet Wert für den Vergleichslink.

Im Wettbewerbs-Tab lässt sich schnell erblicken, auf welche Terme die unmittelbare Konkurrenz setzt und welche Keywords diese als Proof-Keywords nutzen.

Der WDF*IDF-Texteditor geht einen umgekehrten Ansatz. Hierbei gibt man ein Keyword vor, auf das hin optimiert werden soll und danach verfasst man seinen Text. Zwischendurch kann man den Text aus dem Editor heraus immer wieder analysieren lassen. Nach der jeweiligen Analyse zeigt der Editor direkt an, welche Keywords wie häufig im Text genutzt werden sollten.

WDFIDF Texteditor  WDFIDF Texteditor - Start  WDFIDF Texteditor - Analyse

Der Editor hilft also proaktiv beim Verfassen von WDF*IDF-optimierten Texten.

Mehr Besucher dank WDF*IDF AnalyseÜber den Autor: Dieser Artikel, sowie 363 andere Artikel auf code-bude.net, wurden von Raffael geschrieben. – Seit 2011 blogge ich hier über Programmierung, meine Software, schreibe Tutorials und versuche mein Wissen, so gut es geht, mit meinen Lesern zu teilen. Zudem schreibe ich auf derwirtschaftsinformatiker.de über Themen meines Studiums.  //    •  • Facebook  • Twitter


15 Kommentare

  1. Extreme Eliquidsays:

    Extrem hohe Qualität, extrem niedriger Preis! Ins Angebot: große Auswahl von extremen E-Liquid Arten mit hoher Qualität! Als Überraschung können Sie unsere wirklich speziellen e-Liquid Arten, wie Süßigkeit oder Alkoholgeschmack auch probieren.

    • Dazu fällt mir nur eines ein: Extrem bescheuerter Kommentar, weil er extrem keinen Bezug zum Artikel hat.

      Ihren Spam-Link habe ich dabei gleich auch ganz “extrem” entfernt.

  2. Toller Artikel. Wiederetwas gelernt, mit dem man sich noch weiter beschäftigen kann. Danke und weiter so!

  3. Wir haben vor kurzem ein Video zum WDF*IDF Tool erstellt, mit welchem ihr das Tool noch effektiver nutzen könnt und sicherlich das ein oder andere neu hinzulernen könnt: https://www.youtube.com/watch?v=QAfNI6xhSRE

  4. Danke für den Artikel. Schon ein brauchbares Tool diese WDF*IDF-Analyse. Für mich nicht um damit einen Text zu gestalten, sondern mit Hilfe dieser Analyse auch Schwachstellen eines bestehenden Textes erkennen zu können. Natürlich nur ein Faktor, der scheinbar in die Website-Bewertung einfliest.

  5. Also ich hab schon sehr oft von dieser Formel gehört und gelesen. Allerdings werde ich weiterhin für User schreiben. Und für User schreiben bedeutet für mich u.a.:
    – Verständlich schreiben
    – Wichtige Begriffe benutzen, damit die User den Text besser erfassen können
    – Ebenso gängige Formatierungen benutzen um das Lesen einfacher zu machen (Überschriften, Listenpunkte, fettgedruckt etc.)
    – Ausreichend Inhalt bieten und sauber schreiben (Rechtschreibung etc.).
    – Zu weiteren Inhalten verlinken

    Und oh wunder, das sind ja doch teilweise SEO Faktoren :) Evtl. kann man mit der WDF IDF Formel noch ein bisschen mehr Traffic herauskitzeln aber in der Zeit, in der ich eine Formal anwende, arbeite ich lieber an mehr bzw. besseren Inhalten :)

  6. Vielen Dank für den Link zum kostenlosen Tool! Interessiere mich schon länger für WDF*IDF und werde das wdfidf-tool gleich mal ausprobieren.

  7. m.M.n. lässt sich die WDF auf Inhaltliche Prägnanz und die IDF auf Konzeptionalität eines Webprojektes herunterbrechen.

    Der geübte Blogger, der sich auf ein Thema spezialisiert und nicht so wie ich stark nach links und rechts ausreißt, hat den Faktor ja automatisch schon erfüllt.

    Hilfreich finde ich deine Aufzeichnungen lediglich in der Hinsicht, dass man versteht, wie Suchmaschinen diese Prägnanz und Relevanz berechnen. Ich würde das aber auch nicht überbewerten.

    Und eine Frage an dich: Wie war das, so oft WDF*IDF zu schreiben? :P

    Grüße,
    Pascale

    • Das war ziemlich nervig, da ich meine Blogartikel in einem Markdown-Editor schreibe und erst später in WordPress einfüge. Und in Markdown muss man jedes blöde Sternchen (*) mittels \ escapen…

      Andererseits kam ich auch nicht um den Begriff drumherum. Es ist nun mal ein Eigenname für den es m.M.n. kein passendes Synonym gibt.

      Grüße,
      Raffael

  8. Die WDF Analyse ist eine an sich eine gute Sache. Aber ich bin der Meinung das Suchmaschinen mitlerweile auch so gut “lesen” und “verstehen” können das man es mit sowas nicht mehr so genau nehmen muss. Man sollte wie Olaf auch schon meinte nicht nach Formel schreiben sondern in erster Linie natürlich und für den User :)

    Trotzdem werd ichs natürlich mal testen ;))

    • Na klar, soll man in erster Linie für den User schreiben. Da gebe ich dir und Olaf voll und ganz recht. Dennoch macht WDF*IDF in meinen Augen Sinn. Wenn man die Formel mal auf das herunterbricht, was sie eigentlich tut, finde ich das auch ganz verständlich.

      Die Formel gibt doch nur an, welche Keywords die direkte Konkurrenz genutzt hat, die die ersten Plätze belegt. Wenn ich also das Beste (die Terme) aus deren Artikel auch verwende, dann steigere ich zumindest meine Chance in den oberen Plätzen mit zu erscheinen. Nichts desto trotz – der User geht vor!

  9. Ich persönlich verwende SEOlyze und muss sagen bin sehr zufrieden mit dem Tool. Muss aber ganz ehrlich sagen, dass ich über die Formel selbst so meine Zweifel habe bzw. ob die Optimierung dahingehend wirklich so effektiv ist.

    Lieber sollte man bereits beim Schreiben relevante Begriffe einbauen. Die Formel kann ziemlich verfälscht werden durch Spam-Resultate oder einfach Seiten, die nicht durch Content, sondern durch Links ranken :/

    Mein Tipp: Nicht zu viel Gedanken drum machen!

    Viele Grüße aus Braunschweig,

    Olaf

    • Die Verfälschung durch Spam-Resultate kann in der Tat sattfinden. Damit dies jedoch passiert, müssten die spammigen Seiten ja aber in den ersten Suchtreffern mitgelistet sein. Das wiederum würde bedeuten, dass es keine qualitativ hochwertigen Seiten gibt. (Sonst würden diese ja die ersten Plätze belegen.) Wenn die Konkurrenz also ausschließlich spammig ist, dann kann man eigentlich auch auf die WDF*IDF-Analyse verzichten, weil man mit vernünftigem Content so oder so an der Konkurrenz vorbeiranken würde.

      Ein Blick auf die Konkurrenz (und eine Prüfung, ob diese “spammig” ist), sollte also vorab immer gemacht werden.

  10. Sehr interessanter Beitrag. Werde die Tipps auch mal umsetzen. Sehr informativ für mich :-)

  11. Interessanter Artikel. Da habe ich gleich mal meinen ElitePartner-Artikel drauf hin gecheckt. Optimierung steht dann heute Abend an. Mal sehen was es bringt. Werde das wieder berichten.

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Sie dient nur dem Spamschutz.