Data Highlighter: Mikroformat-Auszeichnungen mit Google-Webmaster-Tools

Stephan Czysch
Stephan Czysch

Stephan ist strategischer Online-Marketingberater. Er hilft Unternehmen dabei, bessere Websites zu erstellen und Online-Marketing kanalübergreifend anzugehen. Er spricht regelmäßig auf Konferenzen, hält (Inhouse-)Schulungen und entwickelt SEO-Tools wie getindexed.io zur schnelleren (Neu-)Indexierung von Webseiten bei Google und searchanalyzer.io für eine datengestützte Optimierung mithilfe der Google Search Console.

Mehr von diesem AutorArtikel als PDF laden

Strukturelle Informationen über eine Webseite können Suchmaschinen durch die Analyse von HTML-Elementen wie Überschriften gewinnen. Doch wie sieht es mit der Semantik von Daten aus? Was bedeutet die Zahlenfolge „03047377093“ und wofür steht die Zeichenfolge „Avatar“? Ist Ersteres eine Telefonnummer, eine Bankverbindung oder einfach nur eine lose Aneinanderreihung von Zahlen? Geht es bei „Avatar“ um einen Film oder ist das der Name eines Unternehmens?

Sogenannte Mikroformate können Suchmaschinen dabei unterstützen, die Semantik von Daten besser zu verstehen. Um die Verbreitung der Einbindung von Mikroformaten zu erhöhen, stellt Google in den Webmaster-Tools den „Data Highlighter“zur Verfügung. Diesen beleuchtet Stephan Czysch im Folgenden genauer. 

Je nach Kontext kann eine Ziffernfolge eine komplett andere Bedeutung haben. Doch Google, Bing und Co. möchten möglichst genau wissen, wofür diese Ziffernfolge auf genau dieser Webseite steht und was sie bedeutet. Aber wie soll das gehen? Durch die HTML-Version 5 werden beziehungsweise haben Mikroformate und -daten sowie weitere semantische Elemente wie Navigations- und Footer-Bereiche zwar auf noch breiterer Basis Einzug erhalten, doch auch für andere HTML-Versionen soll eine genauere semantische Auszeichnung möglich sein. Aus diesem Grund haben sich die großen Suchmaschinenbetreiber zusammengeschlossen und im Juni 2011 mit schema.org ein einheitliches Konzept vorgestellt, welches den bisher sehr fragmentierten Markt für Mikroformate verbessern sollte (http://einfach.st/sose4).

Doch gehen wir einen Schritt zurück: Bereits im Mai 2009 führte Google die Darstellung von „Rich Snippets“ ein (http://einfach.st/irs1). Unter Rich Snippets sind im Quelltext einer Webseite mittels Mikroformaten ausgezeichnete Informationen zu verstehen, die in diesem Fall von Google direkt in der Suche als zusätzliche Information zu einer URL angezeigt werden. Die bekannteste Rich-Snippet-Integration dürften dabei Bewertungen sein. Ein Beispiel einer solchen Darstellung sehen Sie in Abbildung 1.

Um eine solche Darstellung in der Google-Suche zu erhalten, muss zum einen eine von Google unterstützte Informationsart, zum Beispiel „Bewertung“, auf einer Webseite enthalten sein und zum anderen die zur Bewertung gehörende Information in einem vordefinierten, maschinenlesbaren Format ausgezeichnet werden. Ein Beispiel:

<div>Dieser Artikel wurde mit 5 von 5 Punkten bewertet (basierend auf 10 abgegebenen Bewertungen)</div>

Um zu gewährleisten, dass diese Informationen korrekt von Suchmaschinen verarbeitet werden, muss der Quelltext angepasst werden. Bei der Verwendung der Auszeichnung aggregierter Bewertungsinformationen nach schema.org-Vorgabe sieht das wie folgt aus:

 <div itemprop="aggregateRating" itemscope itemtype="http://schema.org/AggregateRating">Dieser Artikel wurde mit <span itemprop="ratingValue">5</span von 5 Punkten bewertet (basierend auf <span itemprop="ratingCount">10</span> abgegebenen Bewertungen) </div>

Durch die Integration der zusätzlichen Informationen ist es Suchmaschinen (zweifelsfrei) möglich, die Informationen über die auf der Website abgegebenen Bewertungen zu verarbeiten. Das Problem für Google und den Webseitenbetreiber liegt hierbei in der Notwendigkeit, Änderungen am Quelltext durchzuführen. Das erfordert auf der einen Seite natürlich das notwendige Know-how, auf der anderen Seite allerdings auch Entwicklungsressourcen. Bereits an diesen beiden Hürden scheitert für viele Webseitenbetreiber die Integration.

Da besonders Google ein sehr ausgeprägtes Interesse an strukturierten Datenquellen zu haben scheint, ist diese Situation für den Suchmaschinenbetreiber nicht ideal. Um Webmastern ein einfacheres Mittel an die Hand zu geben, die auf einer Webseite vorhanden Daten zu strukturieren und maschinenlesbar auszuzeichnen, hat sich Google den Data Highlighter einfallen lassen. Um zu diesem Tool Zugriff zu erhalten, müssen Sie Ihre Website in den Google-Webmaster-Tools verifizieren.

Data Highlighter: Die Alternative zur semantischen Auszeichnung von Daten

Kurz vor Weihnachten 2012 stellte Google im hauseigenen Webmaster-Blog den Data Highlighter vor (http://einfach.st/dhfe3). Die in den Google-Webmaster-Tools unter dem Punkt „Optimierung“ zu findende Funktion war dabei zunächst nur im englischen Sprachraum beziehungsweise über das englischsprachige Google-Webmaster-Tool Interface erreichbar und auf Eventdaten beschränkt. Seit Februar 2013 ist der Data Highlighter allerdings auch in vielen anderen Sprachen verfügbar, darunter auch in Deutsch. Im Mai 2013 spielte Google schließlich ein großes Update für das Tool ein: Zusätzlich zu der Eventauszeichnung ist es jetzt möglich, Produkte, Restaurants, Artikel, Filme, lokale Adressen, Apps und TV-Serien maschinenlesbar auszuzeichnen.

Der Funktionsumfang lässt sich sehr leicht erklären und für viele Webseitenbetreiber umsetzen: Im Data Highlighter wird eine an das Tool übergebene URL des eigenen Webauftritts geladen und durch ein einfaches Markieren von Text- oder Bildinformation („Point-and-Click“) wird die semantische Bedeutung des Elements hervorgehoben. Je nach gewähltem Informationstyp (z. B. Produktdaten oder Firmenadressen) sind dabei unterschiedliche Informationen beziehungsweise Markierungen zwingend notwendig. Im Falle von Firmenadressen sind das der Name des Unternehmens, die postalische Anschrift sowie die Telefonnummer.

So zeichnen Sie Adressdaten aus

Angenommen, Sie möchten Ihre Unternehmensdaten auszeichnen, so wählen Sie im Data Highlighter als Datentyp „Lokale Unternehmen“ und geben dazu eine URL Ihrer Webseite an, auf der Adressdaten enthalten sind. Adressdaten werden zwar aktuell nicht in der in Form von Rich Snippets in der Google-Suche (zumindest außerhalb von Google Maps beziehungsweise Google+ Local) angezeigt, können aber Google zum Beispiel bei der Aggregation von Bewertungen für ein Unternehmen unterstützen.

Bevor der eigentliche Auszeichnungsprozess beginnt, kann zwischen „Diese und ähnliche Seiten taggen“ und „Nur diese Seite taggen“ ausgewählt werden. Im ersten Fall schlägt Google Ihnen im Laufe des Prozesses ähnliche Seiten Ihres Webauftritts vor, die der ausgewählten Seite in den Augen des Suchmaschinenbetreibers ähneln. Alternativ haben Sie die Möglichkeit, selbst ähnliche Seiten auszuwählen oder von vornherein nur eine einzelne Seite auszuzeichnen.

Nach einem bestätigenden Klick auf „OK“ beginnt die Auszeichnung. Ähnlich wie bei der „Inpage-Analyse“ von Google Analytics sehen Sie die vorher definierte URL nebst einer Übersicht der bereits von Ihnen ausgewählten Daten. Mittels der linken Maustaste muss jetzt die Markierung der einzelnen Informationen vorgenommen werden. Nach dem Loslassen der Maustaste erscheint ein Menü, in dem der Datentyp ausgewählt werden muss (siehe Abbildung 3).

Neben den benötigten Informationen können auch weitere Daten markiert werden. So ist es bei lokalen Unternehmensdaten möglich, eventuell auf der Seite angezeigte Bewertungen maschinenlesbar als solche auszuzeichnen. Nachdem alle auf der Seite vorkommenden Informationen markiert sind, muss bei der Auswahl von „Diese und ähnliche Seiten“ im nächsten Schritt eine Seitengruppe definiert werden, um die Auszeichnung zu verifizieren und auf ähnliche Seiten des eigenen Webauftritts zu übertragen. Eine Seitengruppe ist dabei eine Zusammenstellung ähnlicher Seiten des eigenen Webauftritts.

Das Vorgehen ist für die anderen aktuell unterstützen Datentypen, wie beispielsweise Produkte, komplett analog: Nach der Auswahl einer Beispielseite müssen die benötigten und auf Wunsch auch optionalen Informationen ausgezeichnet und gegebenenfalls auf weiteren ähnlichen Seiten verifiziert werden.

Nach Abschluss des Markierens sehen Sie auf der Data-Highlighter-Seite eine Übersicht der bisher vorgenommenen Datenauszeichnungen auf der Domain. Auf dieser Übersichtsseite können auf Wunsch auch erfasste Auszeichnungen wieder gelöscht werden.

Bekannte Probleme

Aktuell funktioniert der Data Highlighter an manchen Stellen noch nicht ganz fehlerfrei. So kommt es mitunter vor, dass die ausgewählte URL nicht vollständig geladen wird, wodurch eine Auszeichnung nicht durchgeführt werden kann. So sieht man beispielsweise auf Abbildung 3, dass nicht alle Bilder im unteren Seitenbereich geladen werden konnten. Während das Facebook-Logo noch problemlos dargestellt wurde, wird anstelle von unter anderem Twitter der Alt-Text angezeigt. Im Falle der Beispielseite führt dies zu keinen Problemen – das kann allerdings auch anders sein.

Ein großes Problem stellen aktuell auch Pop-up-Fenster dar. Da im Highlighter-Fenster keine Elemente geschlossen werden können, überlagert das Pop-up im ungünstigsten Fall den Seiteninhalt, der ausgezeichnet werden soll. Hier hilft aktuell nur eine temporäre serverseitige Deaktivierung des Pop-ups.

Der Data Highlighter ist mit Sicherheit eine spannende Funktion für alle Webseitenbetreiber, die bisher aufgrund fehlenden Know-hows oder fehlender IT-Ressourcen auf eine Datenauszeichnung im Quelltext und die sich (potenziell) aus der Auszeichnung ergebenden positiven Rankingveränderungen verzichten mussten. Durch die einfache Bedienung des Tools ist es nun für viele möglich, Mikroformatauszeichnungen durchzuführen.

Kritisch angemerkt werden muss, dass es sich beim Data Highlighter um eine Insellösung handelt. Während die Idee von schema.org die Vereinheitlichung und die Schaffung eines Standards für semantische Datenauszeichnungen war, zeichnen Sie mit dem Data Highlighter die auf Ihrer Webseite dargestellten Informationen nicht für alle Suchmaschinen, sondern nur für Google aus. Wettbewerber im Suchmaschinenmarkt, wie z. B. Bing, müssen demnach auf diese Information verzichten und können ihre Algorithmen nicht mit diesen zusätzlichen Informationen füttern. Aus meiner Sicht ist davon auszugehen, dass sich dies nicht gerade positiv auf die Ergebnisqualität der Google-Wettbewerber im Suchmaschinenmarkt auswirken wird. 

Semantische Auszeichnungen von Daten, ob mittels Quelltext oder über den Data Highlighter, bringen allerdings auch Gefahren mit sich: Es ist nicht mit letzter Bestimmtheit vorherzusagen, wie die gewonnenen Daten von Suchmaschinen verwendet werden. Ein Beispiel: Durch die Auszeichnung der EAN-Nummer eines Produktes und dessen Preises ist es denkbar, dass diese Informationen in einen Google-Preisvergleich integriert werden könnten.  Während Google aktuell durch die teilweise Umwandlung von Mikroformatinformationen in Rich Snippets durchaus Anreize für Webseitenbetreiber liefert, Daten entsprechend auszuzeichnen, ist ein langfristiger positiver Effekt auf den eigenen SEO-Traffic nicht zwangsläufig garantiert. Unbeantwortet lassen möchte ich an dieser Stelle die Frage, ob man es sich z. B. als Onlineshop überhaupt erlauben kann, auf diese Auszeichnungen zu verzichten, wenn diese vom Wettbewerber verwendet werden. Als problematisch kann sich hier eine eventuell höhere Klickrate des Wettbewerbs durch Rich-Snippet-Elemente und damit verbundene Umsatzvorteile erweisen.

Insgesamt betrachtet ist der Data Highlighter in vielerlei Hinsicht ein cleverer Schachzug von Google und eine echte Zeitersparnis für alle Webseitenbetreiber, die eine semantische Auszeichnung von Informationen vornehmen wollen, ohne dabei Änderungen am Quelltext durchzuführen bzw. durchführen zu müssen.