Strukturierte Daten: Eine Bestandsaufnahme und ein Ausblick

Lennart Leienbach
Lennart Leienbach

Lennart Leienbach ist SEO Consultant bei der Berliner Performance-Marketing-Agentur CLANEO. Er unterstützt Start-ups, KMU und Konzerne in den Bereichen Suchmaschinenoptimierung (SEO), App-Store-Optimierung (ASO) und Marktplatzoptimierung (MPO). Vor seiner Anstellung bei CLANEO arbeitete Lennart drei Jahre als SEO Analyst bei Performics (bis 2015 AKM3).

Mehr von diesem AutorArtikel als PDF laden
Matthäus Michalik
Matthäus Michalik

Matthäus Michalik ist Gründer und Geschäftsführer von Claneo, einer SEO- und Content-Marketing-Agentur mit Sitz in Berlin. Mit seiner Expertise berät er Start-ups, KMU und Konzerne in den Bereichen Suchmaschinenoptimierung (SEO) und Content-Marketing. Neben der Beratung großer und internationaler Kunden fällt seine Verantwortlichkeit vor allem in die Bereiche Agenturmarketing und New Business. Gemeinsam mit einem starken Team prägt er die Agentur und definiert deren zukünftige und strategische Ausrichtung.

Mehr von diesem AutorArtikel als PDF laden

Strukturierten Daten ermöglichen Webseiten-Betreibern, Inhalte für Suchmaschinen und deren Crawler mit einer semantischen Bedeutung auszuweisen und somit verständlicher zu machen. Der Beitrag von Matthäus Michalik und Lennart Leienbach beleuchtet, was strukturierte Daten sind, was sie können, wie man sie am besten verwendet, was sie mit SEO zu tun haben und welche Bedeutung ihnen in Zukunft noch zukommen könnte.

Der Begriff „strukturierte Daten“ ist zunächst einmal ein sehr allgemeiner. Strukturiert liegen Daten – egal in welchem Kontext – immer dann vor, wenn sie einem bestimmten Muster, einem Format folgen, wenn sie also nach einem bestimmten Schema organisiert sind. Das Wort „Schema“ wird uns genau deshalb gleich noch einmal begegnen.

Eine bestimmte Struktur schafft Ordnung, stellt eine Interpretierbarkeit her, und genau an dieser Stelle kommt das Internet ins Spiel – genauer gesagt: Websites und Suchmaschinen. Letztere dienen dem Zweck, einem Internetnutzer Ergebnisse zu präsentieren, die seiner Intention bei einer bestimmten Recherche möglichst genau entsprechen.

Dabei haben Suchmaschinen es in der schier unendlich großen Welt des World Wide Web mit Unmengen an Informationen zu tun. Wörter, Bilder, technische Details, Mail-Adressen, Preise – dies und vieles, vieles mehr sind Daten. Die Herausforderung besteht für Google, Yahoo und Co. darin, diese Daten wahrzunehmen, zu sortieren, in gewisser Weise „zu verstehen“ (eigentlich: zu interpretieren) und dann zum geeigneten Zeitpunkt als Suchergebnis auszugeben.

Betreiber von Websites (zum Beispiel Online-Shops) haben die Möglichkeit, den Suchmaschinen bei ihrem Job behilflich zu sein. Man muss ihnen die Interpretationsleistung nicht ganz allein überlassen. Diese Hilfestellung danken sie dem Webmaster mitunter durch aussagekräftigere Suchergebnisse, die dem Nutzer noch besser zeigen, was ein Website-Betreiber ihm auf einer bestimmten Seite bietet.

Das gemeinsame Projekt „Schema.org“

2011 haben sich die weltweit bedeutendsten Suchmaschinen zusammengetan und die Initiative Schema.org ins Leben gerufen. Heute stehen Google, Yahoo, Bing (Microsoft) und Yandex hinter dem Open-Source-Projekt. Dessen Ziel ist die einheitliche Auszeichnung von Website-Inhalten mit dem Zweck, besser für die Suchmaschinen interpretierbar zu sein.

Schema.org stellt gewissermaßen ein gemeinsames Vokabular, eine Ontologie dar. Es werden in dem Verzeichnis, das jeder auf www.schema.org einsehen kann, nach und nach alle erdenklichen Entitäten („things“), Handlungen und Relationen katalogisiert. Verkaufe ich beispielsweise in meinem Online-Shop Bücher, so kann ich die einzelnen Produktseiten jeweils so kennzeichnen, dass Suchmaschinen wissen: „Hier geht es um [Book]!“

Die Entität [Book] steht normalerweise für konkrete literarische Werke mit ganz spezifischen Eigenschaften. Diese Eigenschaften kann ich den Suchmaschinen in einem zweiten Schritt näherbringen. Dabei fülle ich mehr oder weniger umfangreich (je nach meinen Ressourcen und Absichten) eine Maske aus „Properties“ aus; jedes Property steht für eine bestimmte Eigenschaft. So liegt es etwa nahe, unter anderem Buchtitel, Verfasser, Seitenzahl, Sprache, ISBN-Nummer und/oder Preis zu definieren.

Zum Vokabular fehlt noch die Grammatik

Mit Schema.org haben die „Big Player“ unter den Search Engines also eine Art stetig wachsendes Lexikon geschaffen mit Einträgen, die für das Internet besonders relevant sind. Damit aus einzelnen Vokabeln aber eine Sprache wird, braucht es außerdem Grammatik. Sie lässt es mit ihren Regeln zu, einzelne Wörter so miteinander zu verbinden, dass etwas darüber etwas ausgesagt werden kann. Genau diese Grammatik stellen die verschiedenen Auszeichnungssprachen („Annotationen“) zur Verfügung: JSON-LD, HTML Microdata und RDFa.

Jede Grammatik funktioniert dabei unterschiedlich, aber sie alle bieten mir als Website-Betreiber die Möglichkeit, meine gesamte Homepage und auch einzelne Seiten darin mithilfe strukturierter Daten auszuzeichnen. Was die Vor- und Nachteile der Auszeichnungssprachen sind und was sich derzeit aus welchen Gründen als die brauchbarste erwiesen hat, wird an späterer Stelle näher beleuchtet. Wichtig ist zunächst, dass eine Suchmaschine nun jede Menge Dinge über mich und meine Seiten weiß.

Die Früchte der Auszeichnungsarbeit

Die Informationen, die ich der Suchmaschine leicht verdaulich übermittelt habe, sind in einigen Fällen besonders nützlich für sie – und damit auch für mich. Sie kann nämlich nun im Brustton der Überzeugung noch mehr über mein Suchergebnis sagen. So kann es mitunter dazu kommen, dass mein Suchergebnis auf einer Suchergebnisseite nicht nur als gewöhnliches Snippet aus Title, URL und Meta-Description ausgegeben wird, sondern als ein um bestimmte Informationen angereichertes Snippet, nämlich als „Rich Result“ (ehemals auch „Rich Snippet“ genannt).

Abbildung 2 zeigt einen Screenshot einer Google-Suche nach „der insasse“, dem neuen Roman von Sebastian Fitzek. Ganz oben ist ein gewöhnliches Snippet zu sehen (das von Amazon.de allerdings überhaupt nicht ordentlich gestaltet wurde), während im Fall der letzten drei Ergebnisse Rich Results geboten werden. Das Rich Result von Buecher.de bietet anstelle der eigentlichen URL eine sogenannte Breadcrump, die es dem Suchenden leichter machen soll, die Einordnung der Seite auf der Gesamt-Homepage nachzuvollziehen. Wirklich gelungen ist das hier allerdings nicht, denn was ein Thriller, den ich überall auf der Welt in deutscher Sprache online bestellen kann und der auch nicht in Berlin spielt, nun mit „Europa > Deutschland > Berlin“ zu tun hat, weiß wohl nur Buecher.de.

Besser macht es da schon Weltbild.de, wo nicht nur eine vernünftige Meta-Description formuliert wurde, sondern die Breadcrump tatsächlich klar macht: Das Buch ist offenbar als ein „packender Thriller“ im Shop eingeordnet. Dazu ist das Snippet auch noch mit Bewertungssternen angereichert, die sich aus den Käufer-Rezensionen auf der Seite ergeben. Thalia.de wiederum verzichtet bei seinem Ergebnis zwar auf eine Breadcrump-Navigation, gibt dem Suchenden aber dank Bewertungssternen ebenfalls einen ersten Hinweis zur Qualität des Buches. Thalia.de trumpft aber zusätzlich noch mit der Angabe des Preises sowie dem Lagerstatus auf.

Bin ich als Kunde kurz angebunden und möchte nur wissen, wo ich das Buch auf jeden Fall bestellen kann und was es mich kostet, dann werde ich wohl zuerst hier klicken – die Click-Through-Rate (CTR) von Thalia.de könnte also durchaus besser aussehen als die von Weltbild.de, obwohl Letztere zwei Positionen weiter oben rankt. An diesem Beispiel lässt sich gut ablesen, dass strukturierte Daten in einer Hinsicht eher nicht als SEO-Instrument taugen: Durch sie werde ich nicht unmittelbar meine Rankings verbessern können. Indirekt aber vielleicht doch, denn eine bessere CTR wird von Google durchaus wahrgenommen und unter Umständen über kurz oder lang auch mit einer besseren Platzierung belohnt.

Breadcrump, Bewertungen, Preis, Verfügbarkeit – all dies speist sich aus strukturierten Daten. Um eines aber klar zu sagen: Dass ich strukturierte Daten anbiete, garantiert nicht, dass ich auch Rich Results erhalte. Aber anders herum ist garantiert, dass es ein Rich Result ohne strukturierte Daten für mich nicht geben wird. Eine Form von Rich Results, die vor allem im Mobile-Search-Bereich Bedeutung haben, sind sogenannte „Carousels“. Auf dem Screenshot von Abbildung 3 sieht man beispielsweise, wie Chefkoch.de seine Rezepte für „spinatlasagne“ um Bilder als strukturierte Daten angereichert hat.

Das belohnt Google auf dem Smartphone damit, dass der Nutzer die unterschiedlichen Rezept-Vorschaubilder durchswipen kann, bis er eines sieht, das ihn besonders anspricht. Die Chance, dass Chefkoch.de hier anstelle eines normalen, weiter unten stehenden Ergebnisses angeklickt wird, ist ziemlich hoch. Nicht zu verwechseln sind die Rich Results übrigens mit „Featured Snippets“, bei denen Google einen größeren Content-Ausschnitt von einer Seite in einem prominenten Fenster ganz oben anzeigt. Auf Featured Snippets, die dem Suchenden ohne jeden Website-Besuch möglichst alle Fragen direkt beantworten sollen, haben strukturierte Daten keinen Einfluss.

Dass Google bei der Desktop-Suche nach „spinatlasagne rezept“ ein Featured Snippet aus der Rezeptseite von Essen-und-trinken.de anbietet (Abbildung 4), liegt also allein daran, dass die Suchmaschine den Inhalt der Seite als denjenigen bewertet hat, der die Suchanfrage am besten und prägnantesten beantwortet. Google sagt: „Du willst also Spinatlasagne backen und brauchst ein Rezept? Ich habe hier neulich eine Seite gecrawlt, die ein prima Rezept bietet, das du direkt auf der Suchergebnisseite lesen kannst. Du musst gar nicht mehr auf die Seite gehen!“

Weitere mögliche Arten der Anreicherung von Snippets zu Rich Results mittels strukturierter Daten zeigt Google in seiner Search Gallery: einfach.st/seagal. Bevor man sich nun näher damit beschäftigt, wie strukturierte Daten technisch am besten zu implementieren sind und welche zukünftigen Potenziale in ihnen schlummern könnten, bleibt zunächst das Zwischenfazit: Rein theoretisch kann man den Suchmaschinen nie zu viele (korrekte!) Informationen über sich, seine Produkte oder Dienstleistungen liefern. Da allerdings die Ressourcen beim Integrationsprozess naturgemäß endlich sind, sollte man versuchen, die für sich wesentlichen Aspekte zu bestimmen und als „structured data“ anzubieten.

Wie lassen sich strukturierte Daten implementieren?

Unterschieden werden kann zunächst einmal zwischen Spezifikationen für die Qualität der Daten und Spezifikationen für die technische Umsetzung. Zu den inhaltlichen Qualitätsanforderungen zählt, dass nur einzigartige Inhalte ausgezeichnet werden dürfen. Mit anderen Worten: Nur von mir selbst oder durch meine Nutzer erstellte Inhalte sollten ausgezeichnet werden. Des Weiteren müssen die ausgezeichneten Inhalte für Nutzer sichtbar sein. Wird bspw. ein Produkt ausgezeichnet, sollte dieses auch tatsächlich auf der Seite zu sehen sein. Ebenso dürfen keine irrelevanten oder irreführenden Inhalte ausgezeichnet werden. Darunter fallen etwa gefälschte Rezensionen oder Inhalte, die nichts mit dem Hauptinhalt einer Seite zu tun haben.

Aus technischer Sicht ist es natürlich eine Grundvoraussetzung, dass alle Inhalte, die in den Suchergebnissen gelistet werden sollen, für Suchmaschinen und ihre Bots aufrufbar sind. Das heißt, der Zugang sollte nicht durch Einträge in der robots.txt oder mittels anderer Methoden blockiert werden. Für die Implementierung sollten zudem JSON-LD, RDFa oder Microdata verwendet werden. Um etwaige Fehler und Doppel-Auszeichnungen zu vermeiden, ist zu empfehlen, sich auf eines der drei Formate zu beschränken. Die drei Annotationsformate unterscheiden sich dabei wie folgt:

JSON-LD (JavaScript Object Notation for Linked Data) ist die jüngste Methode, strukturierte Daten auszuzeichnen. Zudem ist es das Format, das Google regelmäßig empfiehlt und am breitesten unterstützt. Einer der größten Vorteile von JSON-LD ist zudem, dass es – im Gegensatz zu anderen Formaten – unabhängig vom restlichen Quellcode einer Internetseite eingebunden werden kann. Wie unter anderem auch die Meta-Description wird auch JSON-LD im <head>-Bereich (dem „Kopf“) eines HTML-Dokumentes implementiert. Die dadurch gewonnene Unabhängigkeit vom tatsächlichen Content der Seite ermöglicht die einfache Anpassbarkeit des Seiten-Templates sowie der strukturierten Daten – und zwar ganz unabhängig voneinander.

Die Implementierung mittels RDFa basiert auf einem etwas anderen Ansatz: Anstatt die strukturierten Daten wie bei JSON-LD in einem (auch für Menschen) leicht lesbaren Block zusammenzufassen, werden sie über den gesamten Inhalt einer Seite verteilt. Bei RDFahandelt es sich um „HTML5 Extensions“. Bestehende HTML-Elemente werden erweitert und mit zusätzlichen Informationen versehen, etwa zur Auszeichnung strukturierter Daten.

Auch bei Microdata kommen HTML-Erweiterungen zum Einsatz. Microdata gilt jedoch als veraltet und wird nicht mehr aktiv weiterentwickelt. Dennoch setzen nach wie vor einige Websites das Format ein. Es schadet deshalb nicht, schon einmal davon gehört zu haben.

Welche Form der Auszeichnung sollte genutzt werden?

Für den Fall, dass bisher noch keine strukturierten Daten auf einer Website eingebunden sind, empfiehlt sich eindeutig die Nutzung von JSON-LD. Aufgrund der Unterstützung von Google, Bing (seit Juli 2018) und Baidu ist man für drei der großen vier Suchmaschinen somit gewappnet. Einzig die russische Suchmaschine Yandex unterstützt bislang nur Microdata sowie RDFa. Sollten bereits Inhalte mithilfe von Microdata oder RDFa ausgezeichnet worden sein, kann man dies selbstverständlich beibehalten. Es sollte jedoch regelmäßig überprüft werden, wie lange die Suchmaschinen das Format in Zukunft noch unterstützen.

Weitere Anforderungen:

Für einige der Markups gelten zusätzliche Anforderungen, die bei der Implementierung berücksichtigt werden sollten. Diese speziellen Richtlinien werden wie oben schon erwähnt im „Feature Guide“ im Google-Developers-Portal (http://einfach.st/seagal) benannt.

Häufige Fehler bei strukturierten Daten

Bei der Vielzahl an verschiedenen Richtlinien können bestimmte Fehler in den Markups recht schnell vorkommen. Selbst Googles Test-Tool für strukturierte Daten kann nicht immer hilfreich sein. Einige dieser schnell zu übersehenden, aber leicht zu vermeidenden Fehler sind die folgenden:

Auszeichnen von Bewertungen oder Rezensionen von Drittanbietern

Auch wenn die Verwendung von Widgets von Drittanbietern zur Einbettung von Bewertungen im Allgemeinen kein Problem darstellt, gibt es in Bezug auf strukturierte Daten einige Punkte zu beachten. Besonders wichtig ist es, dass sich das Review-Markup immer auf den Hauptinhalt einer Seite bezieht. Falsch wäre es z. B., wenn die allgemeine Bewertung eines Shops (per Widget) seitenweit angezeigt und dadurch auch für jede einzelne Produktseite ausgezeichnet würde. Da die Bewertung sich auf das Unternehmen selbst, nicht jedoch auf die einzelnen Produkte bezieht, würde Google dies als Spam ansehen. Zudem müssen Bewertungen und Rezensionen, die nicht von der eigenen Website stammen, immer einen Link zur Quelle enthalten. Benutzern und Searchbots muss gleichermaßen gezeigt werden, woher die Bewertungen stammen.

Inhalte, die für den Benutzer nicht sichtbar sind

Ausgezeichnete Inhalte müssen für Desktop- und Mobile-Nutzer auch grundsätzlich sichtbar sein. Der Nutzer muss immer klar erkennen können, wo sich die Inhalte auf einer bestimmten Seite befinden, die durch ein Rich Result in den Suchergebnissen angeteasert wurden. Allerdings erlaubt es Google ausdrücklich, wenn aus Usability-Gründen die entsprechenden Inhalte auf der mobilen Seite zunächst in einem Tab „versteckt“ sind und erst nach einem Klick durch den Nutzer sichtbar werden. Voraussetzung ist natürlich auch hier, dass der Suchmaschinen-Bot den „Tabbed Content“ auch auslesen kann.

Irreführende oder ungeeignete Inhalte

Es sollte immer darauf geachtet werden, dass die ausgezeichneten Inhalte auch korrekt sind. „Katzenspielzeug, das Ihre Kätzchen lieben werden“ ist für Google bspw. kein gültiger Produktname. Besser wäre „Kratz- und Kletterbaum in Schwarz für Katzen“. Ein weiteres Negativbeispiel bestünde darin, eine Pauschalreise inklusive Flug, Hotel und Tickets für ein Konzert der Foo Fighters als Veranstaltung (Event) auszuzeichnen. Die Kennzeichnung des Konzertes selbst als Veranstaltung entspricht jedoch den Richtlinien.

Haben strukturierte Daten eine SEO-Relevanz?

Die Frage, ob strukturierte Daten für die Suchmaschinenoptimierung bedeutsam sind, lässt sich zugleich bejahen und verneinen. Einen direkten Einfluss auf die Ranking-Position einer Seite in den Suchergebnissen haben strukturierte Daten meist nicht. Google und Co. bewerten die Inhalte einer Internetseite nicht anders, wenn diese ausgezeichnet wurden. In den meisten Fällen erhöhen allerdings die durch die strukturierten Daten möglich gemachten Rich Results die Click-Through-Rate (CTR, auch Klickrate) eines Ergebnisses. Suchergebnisse mit gelben Bewertungssternen etwa setzen sich allein schon visuell von normalen Snippets als Suchergebnisse ab. Wurde obendrein eine gute Bewertung erreicht, ist die Wahrscheinlichkeit dafür, dass Nutzer auf das Ergebnis klicken, weitaus höher als bei Ergebnissen ohne Bewertungssterne. Dadurch verbessern sich oftmals die generellen Nutzer-Metriken einer Seite. Indirekt können strukturierte Daten somit durchaus einen Einfluss auf SEO haben.

Eine Besonderheit stellen außerdem Rich-Result-Ergebnisse für Artikel („Article“), Rezepte („Recipe“) und einige weitere „Search Features“ dar: Werden eigene Inhalte korrekt ausgezeichnet, haben sie die Chance, in besonderen Boxen wie dem weiter oben vorgestellten „Rezept-Carousel“ ausgespielt zu werden. Solche Boxen befinden sich meist sehr weit oben auf der ersten Ergebnisseite – und weit oben zu sein, ist das Ziel von Suchmaschinenoptimierung.

Tools für strukturierte Daten

Für strukturierte Daten gibt es mittlerweile zahlreiche Tools, die einem Webmaster beim Implementieren oder auch Überprüfen der eigenen Auszeichnungen helfen können.

Hat man gerade erst damit begonnen, sich mit dem Thema „strukturierte Daten“ zu befassen, kann Googles „Codelab“ (http://einfach.st/codelab2) dabei helfen, den Einstieg schnell zu meistern. Anhand praktischer Beispiele wird man hier Schritt für Schritt an das Thema herangeführt. Derzeit ist diese Hilfe allerdings nur auf Englisch verfügbar.

Für Anfänger und auch Fortgeschrittene gleichermaßen geeignet ist der „Schema Markup Generator (JSON-LD)“ von Technicalseo.com (http://einfach.st/markupgen). Er deckt alle gängigen Markups ab und valider Quellcode kann mit wenigen Klicks erstellt werden.

Zu den essenziellen Tools für das Testen strukturierter Daten gehört Googles „Test-Tool für strukturierte Daten“ (http://einfach.st/markupgen2). Damit lassen sich einzelne Quellcode-Schnipsel oder auch ganze URLs überprüfen.

Kein Tool im engeren Sinne, aber durchaus auch praktisch ist die Website Jsonld.com. Frei nach dem Motto „Steal our JSON-LD“ (zu Deutsch: „Stiehl unser JSON-LD“) werden hier für verschiedenste Anwendungsfälle gut aufbereitete Quellcode-Beispiele präsentiert.

Für denjenigen, der des Öfteren verschiedene URLs auf strukturierte Daten hin überprüfen möchte, ist das folgende JavaScript-Lesezeichen für den Browser eine gute Wahl. Dazu muss im Browser zunächst ein neues Lesezeichen angelegt werden. Anstelle einer URL trägt man jedoch folgenden Code ein:

javascript:(function(){ window.open('https://search.google.com/structured-data/testing-tool/u/0/#url='+encodeURIComponent(location.href))})();

Surft man anschließend auf eine Seite, die man hinsichtlich strukturierter Daten überprüfen möchte, reicht ein Klick auf das Lesezeichen. Sogleich öffnet sich in einem neuen Browser-Tab die entsprechende URL in Googles „Test-Tool für strukturierte Daten“.

Zuletzt sei auch auf die zahlreichen Plug-ins hingewiesen, die es für viele CMS (Content-Management-Systeme) gibt, etwa für WordPress. Sie sind mal mehr, mal weniger umfangreich, erledigen ihren Job jedoch in den meisten Fällen zuverlässig und vereinfachen das Implementieren strukturierter Daten. Es ist daher definitiv lohnenswert, einmal einen Blick in den Plug-in-Store des jeweiligen CMS zu werfen.

Was kommt als Nächstes?

Seit der Einführung strukturierter Daten kamen immer wieder neue Auszeichnungsmöglichkeiten hinzu. Was sich aktuell in einer Art Beta-Phase befindet und in Zukunft eventuell bei Schema.org einmal als Standard hinzugefügt werden könnte, findet man auf pending.schema.org. So hat Google im August 2018 bspw. die Auszeichnung für „Speakable Content“ aufgenommen und unterstützt sie seitdem: einfach.st/speak. Dabei handelt es sich um Inhalte, die gut von Voice-Assistenten und Smart Speakern vorgelesen werden können. Derzeit ist die Auszeichnung „speakable“ ausschließlich für Publisher vorgesehen, aber es ist davon auszugehen, dass sie in Zukunft für alle Websites genutzt werden kann.

Es ist sehr wahrscheinlich, dass in den kommenden Jahren immer wieder neue Auszeichnungsmöglichkeiten von Google unterstützt werden. Des Weiteren hat das Einbinden strukturierter Daten nicht mehr nur allein einen Effekt auf die klassischen Suchergebnisse bei der Google-Suche, wie am Beispiel von „Speakable Content“ ersichtlich ist. Vielmehr ist es Websites dadurch möglich, sich auch in anderen Search-Bereichen zu positionieren und somit den eigenen Traffic zu steigern.