Jetzt müssen Sie noch die abzufragenden Verzeichnisse eintragen. Wie oben bereits erklärt, funktioniert das natürlich nur dann vernünftig, wenn Sie Ihre Content-Formate auch sauber in Verzeichnissen organisiert haben. An der Stelle
PATHS <- c(
"https://www.domain.de/de/verzeichnis1/",
"https://www.domain.de/de/verzeichnis2/",
"https://www.domain.de/de/verzeichnis3/",
"https://www.domain.de/de/verzeichnis4/",
"https://www.domain.de/de/verzeichnis5/"
)
überschreiben Sie einfach die Platzhalter www.domain.de/de/verzeichnis1/ bis zu …/verzeichnis5/ mit Ihren eigenen. Wollen Sie weniger Verzeichnisse abfragen, dann löschen Sie einfach die entsprechenden Zeilen. Sollen es mehr sein, dann fügen Sie jeweils eine Zeile hinzu nach dem Muster:
"https://www.domain.de/de/verzeichnis-N/"
Wollte man z. B. wissen, wie performant bei Aldi Süd die einzelnen Content-Formate funktionieren, würde man die folgenden Einträge verwenden:
PATHS <- c(
"https://www.aldi-sued.de/de/angebote/",
"https://www.aldi-sued.de/de/infos/",
"https://www.aldi-sued.de/de/ratgeber/",
"https://www.aldi-sued.de/de/rezepte/",
"https://www.aldi-sued.de/de/sortiment/"
)
Das war schon alles, was zur Vorbereitung gemacht werden muss. Am besten speichern Sie sich Ihr modifiziertes Skript als .R-Datei in Ihrem aktuellen Arbeitsbereich ab (STRG + S oder über das Menü File > Save) und können dann später bei Bedarf darauf zugreifen, ohne erneut etwas ändern zu müssen. Interessant sind ja wie immer die Veränderungen im Zeitverlauf. Wenn Sie das Skript also in definierten Intervallen mit dem jeweiligen Datumseintrag laufen lassen und die Ergebnisse jeweils archivieren oder gegenüberstellen, entsteht eine aufschlussreiche Zeitreihe – sofern Sie parallel tatsächlich auch Ihre Maßnahmen an der Website bzw. diesen Verzeichnissen zurückverfolgen können. Nur dann können Sie Maßnahme und Veränderung einigermaßen in Beziehung zueinander setzen.
Interpretation der Grafik
Mit dem vorliegenden Skript wurde mit den weiter oben beispielhaft erwähnten fünf Content-Art-Verzeichnissen von aldi-sued.de für den 22. Mai 2017 eine High-Performance-Format-Grafik erzeugt (Abbildung 6). Generell gilt von der Lesart: Rechts oben ist gut, links unten ist schlecht. Je weiter rechts ein Kreis bzw. das dahinter liegende Content-Format liegt, desto mehr Top-10-Rankings hat es. Rein theoretisch verteilen sich 100 % aller Rankings auf die zehn Ergebnisseiten der Top 100. Damit wäre bei Gleichverteilung statistisch gesehen jede Ergebnisseite 1–10 mit je zehn Prozent Rankinganteil dabei. Liegt dieser über diesen 10 % für eine Seite, hier natürlich Seite 1, bedeutet das, dass die Content-Art – genauer das Verzeichnis – im Schnitt besser performt als andere.
In der Abbildung 6 ist dann auch recht eindeutig zu sehen, dass die Content-Art „Rezepte“ (lila) sehr gut von Google angenommen wurde. 14 % der in diesem Verzeichnis über URLs vereinten Rankings sind unter den Top 10. Der Ratgeber (grün) hat nur unterdurchschnittlich viele Top-10-Rankings (6 %), aber viele Treffer in den Top 100. Das bedeutet, dass zwar hier wohl quantitativ sehr viel in Content investiert wurde und damit auch viele Rankings erzielt werden – aber eben nur in den Top 100 auf Plätzen, die in der Regel nahezu keinerlei Traffic bringen. Dort findet man also eher Masse statt Klasse.
Lässt man die Berechnung für ein aktuelles Datum, hier der 21. September 2020, erneut laufen, erkennt man unschwer die gravierenden Veränderungen (Abbildung 7). Betrachtet man die y-Achse mit der Anzahl an Top-100-Keywords, erkennt man eine extreme Abnahme der Rankings. Ging die Achse zuerst bis 6.000, sind es aktuell nur noch 2.000. Die vormals performante Content-Art der Rezepte (lila) ist drastisch eingebrochen, während die Inhalte des Verzeichnisses /infos/ deutlich dazu gewonnen haben.