Das Leben ist ein Spiel

– neues Attributionsmodell bei Google AdWords nutzt die Spieltheorie

Kerstin Bischoff
Kerstin Bischoff

Kerstin Bischoff ist Diplom-Mathematikerin und geschäftsführende Gesellschafterin der Altamedinet GmbH. Sie hat in London, Leipzig und Bielefeld studiert sowie in Los Angeles gelebt. Langjährige deutschlandweite und internationale Erfahrung im Bereich E-Business, Business Communication und Projektmanagement hat sie in großen IT-Unternehmen gesammelt. Bei Altamedinet ist sie für die kontinuierliche Betreuung von Kundenprojekten bezüglich Online-Marketing und SEO verantwortlich.

Mehr von diesem AutorArtikel als PDF laden

Wann immer Menschen miteinander agieren, ist es ein Spiel. Es gibt Regeln, Interaktion und am Ende eine Auszahlung für die interagierenden Personen. Jeder versucht, dabei so gut wie möglich wegzukommen und die „Auszahlung“ für sich zu maximieren. Die Interpretation der „Auszahlung“ ist vielfältig. So kann man sich mit dem Freund zusammen entscheiden, welchen Kinofilm man sieht, man kann ein Auto durch eine viel befahrene Straße lenken, an einer Wahl teilnehmen oder ein Produkt in einem Online-Shop einkaufen. Immer lässt sich ein theoretisches Modell aus der Spieltheorie anwenden. Doch die Modelle haben Einschränkungen in der Anwendung. Google gehört nun zu den Ersten, die auch wirklich eine sinnvolle Anwendung schufen. Aber was steckt dahinter, was genau ist ein Shapley-Wert? 

Als 1994 zum ersten Mal der Wirtschafts-Nobelpreis an drei Spieltheoretiker – John Forbes Nash Jr., John Harsanyi und Reinhard Selten – verliehen wurde, schlugen die Herzen der Wirtschaftswissenschaftler gleichermaßen wie die der Mathematiker höher. Ein theoretisches Konzept, welches schon mit Arbeiten von Edgeworth 1881 begann, war in der wissenschaftlichen und wirtschaftlichen Wahrnehmung angekommen und wurde gewürdigt.

Das Thema faszinierte weiterhin und 2012 erhielten Alvin Roth und Lloyd Shapley ebenfalls den Wirtschaftsnobelpreis für ihre Forschungen und Ergebnisse in der Spieltheorie.

Was ist Spieltheorie?

Die Spieltheorie ist ein mathematisches Modell, welches Interaktionen und Gewinne von Beteiligten modellartig erklärt. Lloyd Shapley beschreibt mit seinem spieltheoretischen Shapley-Wert den Beitrag jedes einzelnen Spielers zum Spiel bzw. zum Erfolg des Spiels. Damit wird dieser erstmalig zahlenmäßig messbar.

In der Spieltheorie werden kooperative und nicht-kooperative Modelle unterschieden. Diese Klassifizierung geht auf John v. Neumeier und Oskar Morgenstern zurück, die 1944 ein erstes Buch zur Spieltheorie „The Theory of Games and Economic Behavior“ veröffentlichten. Dies war die Geburtsstunde der ökonomischen Spieltheorie.

In beiden Modellen, ob kooperativ oder nicht kooperativ, gelten gewisse Annahmen:

  • Es gibt immer mehrere handelnde Akteure, „Spieler“ genannt.
  • Der Erfolg der einzelnen Spieler ist nicht nur vom eigenen Handeln, sondern auch von weiteren Spielern abhängig.
  • Die Spieler handeln rational.
  • Jeder Spieler möchte den Gewinn für sich maximieren.

Nicht-kooperative Spieltheorie

Jeder kämpft für sich allein. Die Spieler bilden keine Kooperationen. Es gibt keinerlei Absprachen als Voraussetzung für das Spiel oder bindende Verträge untereinander. So sind die meisten Gesellschaftsspiele nicht-kooperativ. Das bekannteste theoretische Beispiel ist wohl das Gefangenendilemma.

Kooperative Spieltheorie

In der kooperativen Spieltheorie ist nicht nur die Menge der einzelnen Spieler wichtig, sondern auch die Teilmengen. Diese Teilmengen werden Koalitionen genannt. Koalieren alle Spieler miteinander, nennt man das große Koalition. Diese wird uns später noch einmal bei der Berechnung des Shapley-Wertes begegnen.

Auch in kooperativen Spielen versucht jeder Spieler, seinen Gewinn zu maximieren. Aber dies geschieht durch einen günstigen Zusammenschluss verschiedener Spieler, der Koalitionen. Aktuell konnte man ein solches nicht enden wollendes Spiel in allen Medien verfolgen …

Der Shapley-Wert – faire Auszahlung für alle

Man stellt sich vor, es gibt eine Menge {N} mit einer Anzahl n an Spielern. Diese Menge {N} ist die große Koalition. Da man nur diese eine Koalition {N} betrachtet, kann man sie auch einfach nur Koalition {N} nennen. 

Es stellen sich zwei Fragen:

  • Wie hoch ist der Anteil jedes einzelnen Spielers an der Koalition?
  • Wie hoch sollte die Auszahlung für jeden einzelnen Spieler sein?

Wie bestimmt man also, was fair ist?

Folgende Annahmen kann man für Fairness definieren:

Axiom #1: Marginaler Beitrag – Additivität

Der Beitrag eines Spielers zum Spiel wird darüber definiert, was im Spiel dazu gewonnen wird oder verloren wird, je nachdem, ob er dem Spiel beitritt oder es verlässt.

Da man nach einer fairen Verteilung der Auszahlung sucht, schließen sich das zweite und das dritte Axiom logisch an.

Axiom #2: Austauschbare Spieler – Symmetrie

Austauschbare Spieler haben den gleichen Wert. Wenn zwei Spieler den gleichen Wert zur Koalition beitragen, also gegeneinander komplett austauschbar sind, sollen sie auch den gleichen Anteil am Gewinn erhalten.

Axiom #3: Dummy-Spieler

Dummy-Spieler erhalten keine Auszahlung. Wenn jemand keinen Beitrag zur Koalition leistet, bekommt er auch nichts ab. Ist das fair? In den meisten Fällen schon, bei sozialen Systemen natürlich nicht. 

Betrachtet man die drei Axiome, ist das logische mathematische Ergebnis der Shapley-Wert. Diese komplizierte Formel ist gleichzeitig auch die einzige Formel, die den oben genannten drei Axiomen entspricht.

Jetzt wird es wieder lockerer :-) Weniger mathematisch nehmen wird als Beispiel zwei Spieler, Fred und Hanni. Sie backen gemeinsam Kekse. Spieler 1 ist Fred, Spieler 2 ist Hanni. Fred und Hanni wollen sich etwas Geld verdienen und verkaufen am Ende die leckeren Kekse für 1 €/Stück.

Wenn Fred allein in der Küche steht und Kekse backt, schafft er in einer Stunde gerade mal 10 Kekse. Vielleicht nascht er zu viel. Hanni ist etwas konzentrierter bei der Sache, sie schafft 20 Kekse in einer Stunde. Sind Fred und Hanni gemeinsam in der Küche, haben sie mächtig viel Spaß und backen in einer Stunde 40 Kekse.

Fred

  • 1. Fred backt allein 10.
  • 2. Fred kommt zu Hanni in die Küche und sie backen zusammen 40 (20 mehr als Hanni alleine). Marginaler Beitrag von Fred ist da 20.
  • Shapley-Wert: (10 + 20)/2 = 15

Hanni:

  • 1. Hanni backt allein 20.
  • 2. Hanni kommt zu Fred in die Küche und sie backen zusammen 40 (30 mehr als Fred alleine). Marginaler Beitrag von Hanni ist hier 30.
  • Shapley-Wert: (20 + 30)/2 = 25

Fred kann allein 10 Kekse pro Stunde backen, in Koalition mit Hanni aber 40 Stück. Daher ist Hannis marginaler Beitrag zur Koalition 30 Kekse.

Hanni kann allein 20 Kekse pro Stunde backen, in Koalition mit Fred aber ebenfalls 40 Stück. Daher ist Freds marginaler Beitrag zur Koalition 20 Kekse.

Bildet man nun den Durchschnitt zwischen der Anzahl Kekse, die Fred allein backen kann, und seinem marginalen Beitrag zur Koalition mit Hanni und teilt diesen Wert durch 2, erhält man einen Shapley-Wert von 15 für Fred.

Für Hanni ergibt der Shapley-Wert 25.

Dieses Beispiel kann man hier noch mal anschauen: www.youtube.com/watch?v=MHS-htjGgSY

Diese Methode kann nun von zwei Spielern auf drei, vier und beliebig viele erweitert werden.

Schwächen der Theorie

  • Die Spieltheorie geht von der Annahme aus, dass alle Beteiligten rationale Entscheidungen treffen, um ihre Auszahlung zu maximieren. Dies entspricht nicht (vielleicht auch zum Glück) der realen Welt.
  • Die Auszahlungen sind ggf. nicht für alle Beteiligten normiert. Manche wollen mehr Markenpräsenz, andere Gewinnmargen erhöhen.
  • Die Annahme, dass die Spielregeln und die dazugehörigen Auszahlungen allen bekannt sind, ist in der Realität schwer gegeben.
  • Zeit und Umgebung, in denen Entscheidungen getroffen werden müssen, spielen ebenso eine Rolle. Mobile User handeln anders als DesktopUser.

In der Praxis würden Hanni und Fred die gebackenen 40 Kekse einfach durch 2 teilen und jeder würde mit 20 Keksen nach Hause gehen. Dies wäre das lineare Verteilungsmodell.

Das „Last Click”-Modell dagegen würde bedeuten, dass der Letzte, der die Küche betritt, den Ertrag für alle 40 Kekse bekommt. „First Click“ würde bedeuten, dass derjenige, der zuerst in die Küche kommt, den Ertrag für alle 40 Kekse absahnt. Fühlt sich das gerecht an?

Google AdWords und der Shapley-Wert

Google geht in der datengetriebenen Attribution nun einen anderen Weg. Die „Spieler“ sind nicht die Personen, sondern die Keywords der einzelnen Kampagnen bzw. Anzeigengruppen. Die Erfassung erfolgt, soweit möglich, deviceübergreifend. Die „Auszahlung“ ist die Conversion-Wahrscheinlichkeit pro Customer-Journey-Pfad. Es wird eine Auswertung der Customer-Journey-Pfade vorgenommen, die zu einer Conversion führten, und jener, die keine Conversion erzielten, und daraus eine prozentuale Wahrscheinlichkeit für die Conversion einer bestimmten Customer Journey berechnet (in dem Fall die Reihenfolge der Klicks auf die Anzeigen nach der Suche nach einem bestimmten Keyword).

Google schreibt in der deutschen Hilfe recht wenig zum Shapley-Wert im Speziellen. Dies bezieht sich zudem nicht auf AdWords, sondern auf Analytics, bei dem die Channels als Spieler betrachtet werden und nicht die Keywords.

 „Der datengetriebenen Attribution liegt ein Konzept namens Shapley-Wert zugrunde, das aus der kooperativen Spieltheorie stammt. Dadurch werden algorithmische Attributionsempfehlungen für jeden Channel bereitgestellt, der in der Standard-Channelgruppierung definiert ist. Den Marketing-Touch-Points wird jeweils ein Teil der Conversions zugeordnet. Dieser Anteil basiert darauf, wie sehr sich Ihre Marketingaktivitäten auf den entsprechenden, von Ihnen eingerichteten Messwert ausgewirkt haben.“ (Quelle Google, einfach.st/gsupp23)

Wie wird die Attribution berechnet?

Zurück zu Hanni und Fred. Sie beschließen, ihre außergewöhnlich guten Kekse online zu verkaufen und dafür AdWords zu schalten.

Sie beginnen mit drei Anzeigengruppen mit je einem Keyword:

  1. Anzeige A: kekse
  2. Anzeige B: rezept kekse
  3. Anzeige C: kekse kaufen

Diese drei Keywords bilden die Menge der Spieler, zusammen sind sie die große Koalition. Betrachtet wird ein Zeitraum von 30 Tagen. Die ermittelte Wahrscheinlichkeit einer Conversion mit genau einem Touch-Point (also einem Klick auf eine der drei Kampagnen) in 30 Tagen ist wie folgt:

  1. für {kekse} = 1 %
  2. für {rezept kekse} = 2 %
  3. für {kekse kaufen} = 5 %

Betrachtet man die Customer Journeys, die jeweils genau zwei Touch-Points hatten, sind die Wahrscheinlichkeiten für eine Conversion wie folgt:

  • für {kekse, rezept kekse} = 3 %
  • {kekse, kekse kaufen} = 6 %
  • {rezept kekse, kekse kaufen} = 8 %

Zuletzt betrachtet man die Kunden, die alle drei Anzeigen im Laufe ihrer Reise aufriefen:

  • für {kekse, rezept kekse, kekse kaufen} = 15 %

Es ergeben sich genau sechs Kombinationen, in denen die Anzeigen aufgerufen werden können:

  • kekse – rezept kekse – kekse kaufen
  • kekse – kekse kaufen – rezept kekse
  • rezept kekse – kekse – kekse kaufen
  • rezept kekse – kekse kaufen – kekse
  • kekse kaufen – kekse – rezept kekse
  • kekse kaufen – rezept kekse – kekse

Welches Keyword ist wichtig, welches weniger wichtig? Für welche Keywords werden in der datengetriebenen Attribution die Klicks maximiert und so auch mehr Budget verwendet? Wie hoch ist der Beitrag eines einzelnen Keywords zur gesamten Conversion-Wahrscheinlichkeit?

Jetzt wird gerechnet.

Dazu betrachtet man alle Keywords und deren marginalen Beitrag nacheinander.

Für die drei Anzeigen mit dem jeweiligen Keyword gibt es sechs Möglichkeiten, in welcher Reihenfolge ein Klick auf die Anzeigen erfolgen kann. Je nach Reihenfolge, in der sie sozusagen der Koalition beitreten, ist ihr Beitrag zum Gesamtumsatz ein anderer. Diesen Beitrag, auch marginaler Beitrag genannt, sieht man hier in der Tabelle:

Customer Journey (Reihenfolge geklickter Keywords)

Marginaler Beitrag zum Umsatz von „kekse“ (A)

Marginaler Beitrag zum Umsatz von „rezept kekse“ (B)

Marginaler Beitrag zum Umsatz von „kekse kaufen“ (C)

Summe

A-B-C

1 %

2 %

12 %

15 %

A-C-B

1 %

9 %

5 %

15 %

B-A-C

1 %

2 %

12 %

15 %

B-C-A

7 %

2 %

6 %

15 %

C-A-B

1 %

9 %

5 %

15 %

C-B-A

7 %

3 %

5 %

15 %

Summe

18 %

27 %

45 %

 

Shapley-Wert

18 %/6 = 3 %

27 %/6= 4,5 %

45 %/6 = 7,5 %

 

  • Shapley-Wert für Keyword A „kekse“   = 18 %/6 = 3 %
  • Shapley-Wert für Keyword B „rezept kekse“   = 27 %/6 = 4,5 %
  • Shapley-Wert für Keyword C „kekse kaufen“   = 45 %/6 = 7,5 %

Die Summer der drei Shapley-Werte ergibt wieder 15 %, was dem Gesamtumsatz in 30 Tagen für die große Koalition an Keywords entspricht. ,  und  zeigen den Anteil des einzelnen Keywords am Umsatz-Erfolg.

Bedingungen für die Nutzung datengetriebener Attribution

Bei Attributionsmodellen nach Last Click würden eventuell die Keywords „kekse“ und „rezept kekse“ den Budget-Limits zum Opfer fallen und komplett ausgeschlossen werden. Dennoch sieht man durch den Shapley-Wert sehr deutlich, dass sowohl „kekse“ als auch „rezept kekse“ zu einer deutlichen Umsatzsteigerung im Vergleich zu einer Ein-Keyword-Kampagne mit „kekse kaufen“ führen. Die datengetriebene Attribution ist also eine sehr sinnvolle Sache. Es gibt jedoch Bedingungen.

Um die datengetriebene Attribution nutzen zu können, muss man mindestens 15.000 Klicks und mindestens 600 Conversions innerhalb von 30 Tagen generieren. Diese Anzahl ist notwendig, um eine statistische Relevanz zu erlangen.

Da in echten Kampagnen sehr viele Keywords eingebunden sind, kann Google nicht davon ausgehen, dass für alle Teilmengen und deren Kombinationen der Keywords die Conversion-Wahrscheinlichkeit bekannt ist. Google ermittelt also in der datengetriebenen Attribution einen Näherungswert. Wie dieser genau berechnet wird, bleibt undokumentiert. Sicher können dabei auch eigene Weiterentwicklungen und Interpretationen von Google genutzt werden.

Natürlich kann Google nur auf die Touch-Points und Conversions zurückgreifen, die über das deviceübergreifende Tracking bekannt sind. Darüber hinaus kann es noch weitere ungezählte Berührungspunkte geben.

Für den AdWords-Administrator geschehen die Berechnungen mit dem Shapley-Wert komplett im Hintergrund. Das Budget wird automatisch von Google auf die einzelnen Keywords je nach Shapley-Wert verteilt. Lediglich die Aktivierung des datengetriebenen Modells ist notwendig.

Weitergedacht

Da man es im Marketing immer mit vielen verschiedenen Touch-Points zu tun hat, lässt sich das Modell des Shapley-Wertes auch noch auf andere Bereiche anwenden, über Google AdWords hinaus.

A/B-Tests

Die Spieler sind die Design-Elemente, die im Vergleich zum Original geändert wurden.

Attribution ist die Zahl der Conversions, die die Seite in einem bestimmten Zeitraum erzeugt.

Die Attribution wird bei den einzelnen Design-Elementen angewendet. Das Szenario könnte sein: Wenn man ein Feld auf der Landingpage ändert, ist die Verbesserung eine Steigerung der Conversion-Rate zum Beispiel von 1 %, ändert man gleichzeitig zwei Felder, ist die Verbesserung zum Beispiel 10 %.

Da man bei einer Anpassung von angenommen 20 Design-Elementen nicht alle Kombinationen testen kann, könnte man durch unvollständige Attribution eine Näherung erlangen.

Firmeneigenes Marketing bewerten

Die Spieler sind die Marketingkanäle wie Newsletter, Messen, Facebook usw.

Attribution ist der Umsatz oder die Anzahl der Leads in einem definierten Zeitraum (im Jahr 1, in 3 Jahren, …) zum Beispiel von Neukunden.

Eine Attribution kann auch hier wie bei den Touch-Points bei AdWords an die einzelnen Marketing-Kanäle vergeben werden. Die Erfassung der Touch-Points und der Auszahlung kann in einem CRM erfolgen. In einem gut geführten CRM sollte diese Datenbasis vorhanden sein. Das Marketing-Budget kann diesbezüglich zielgerichteter eingesetzt werden. Man könnte durch diese Methode ebenfalls bestimmen, ob man das Marketing-Budget eher in Kanäle steckt, die Leads maximieren, oder in langfristigen bzw. kurzfristigen Umsatz.

Natürlich kann man auch die „Dummy“-Spieler identifizieren, in die man dann kein Budget mehr stecken braucht. Dafür muss man sich vorab aber gute Gedanken machen, was alles zur Auszahlung gehört. Ein Bekanntheitsgrad der Marke folgt da sicher anderen Regeln als der Umsatz. Außerdem ist es auch hier nicht immer möglich, die Touch-Points wie z. B. bei Plakaten oder Print-Anzeigen wirklich zu messen.