Wie macht eine KI das überhaupt?
Für alle, die bei dem Thema der maschinellen Erzeugung von Content noch Einsteiger sind, folgt eine wirklich kurze und stark vereinfachte Erklärung. Zunächst muss man einer Maschine sagen, was man haben möchte. Das geschieht in der Regel mit einer textlichen Formulierung, mit dem Hochladen eines Bildes oder Videos, versehen mit Zusatzinformationen, was damit zu tun wäre oder auch in gesprochener Form. Dieser Input wird an ein Modul weitergegeben, das versucht, die Absicht aus den hinterlassenen Wörtern zu erkennen bzw. zu interpretieren. Diese Systeme sind mittlerweile schon sehr weit fortgeschritten und kommen mit den meisten einfachen Anfragen gut zu recht.
Zur Generierung von Text, Bild, Video oder Ton muss eine Maschine bisher immer trainiert werden. Man braucht also einen möglichst großen Korpus an Dokumenten. Dies können Webseiten sein, aber auch Bücher oder andere informationstragende Medien. Ein Beispiel: Würde eine KI live alle Fernsehsender gleichzeitig empfangen und sowohl das jeweilige Bild (Videos bestehen ja aus einzelnen Bildern) mit dem gleichzeitig oder zuvor/danach gehörten und dekodierten Ton in Zusammenhang bringen, würde sie rein statistisch bemerken: Immer, wenn eine bestimmte Figur zu sehen ist, kommt häufig das Wort „Pferd“ vor. Zusätzlich wird auf der Tonspur oft „braun“, „weiß“, „schwarz“, „Schimmel“, „Rappe“ oder „Brauner“ verwendet. Über eine Farbmessung auf dem Objekt (Pferd) lässt sich das gut verifizieren oder eben falsifizieren. Fällt dann häufig bei einem weißen Pferd auch das Wort „Schimmel“, wäre die nächste Beziehung fixierbar.
Gibt es wichtige Beziehungen zwischen Wörtern oder Themen nur selten in den Datenpools, deren sich die KIs bedienen, werden sie auch weniger repräsentiert und nicht oder nur wenig beim dann automatisierten Output verwendet.
Gehen wir noch einmal einen Schritt zurück. Wie wird heute Content erzeugt, wenn der Websitebetreiber oder die Verantwortlichen keine Zeit, keine Kapazität, keine Muße oder vielleicht auch keine Lust haben, selbst etwas auf das Webpapier zu bringen? Man beauftragt in der Regel eine Textagentur. Dort wirft man ein Thema ein und spezifiziert dazu (hoffentlich) einige Nebenbedingungen. Und dem Vernehmen nach passiert es gar nicht mal so selten, dass sich diese Zusatzinformationen darauf beschränken, für einzelne Keywords die sogenannten WDF-IDF-Werte vorzugeben, die ein Tool bei einer Recherche ausgeworfen hat. Wir beauftragen also z. B. einen Text mit einer bestimmten Anzahl an Worten, der später für das Keyword „digitales Mischpult“ ranken soll. Leider ist bei der Textagentur zufällig kein Toningenieur beschäftigt, es ist also niemand da, der wirklich Know-how in diesem Bereich hätte. Was passiert? Der für die Texterstellung zuständige Mensch googelt. Was soll er auch sonst tun? Wo soll er sich mit tragbarem Aufwand schlau machen? Was hier oft passiert, ist also, dass zwei bis fünf oder sechs Texte gelesen werden und daraus das Wissen extrahiert wird, was ein digitales Mischpult ist und was es kann. Das Wissen wird mit mehr oder weniger anderen Worten und in anderer Reihenfolge dann erneut aufgeschrieben. „Erneut“ deswegen, weil es all diese Informationen ja schon im Web gibt, meist sogar unter den am besten rankenden Dokumenten und die Infoschnipsel neu angeordnet werden. Mit anderen Worten: Es kommt meist rein gar nichts Neues hinzu. Kein neuer Gedanke, kein echter Mehrwert, kein neuer Blickwinkel. Der Kunde zahlt dann, wenn die Plagiatsprüfung negativ ist, d. h., ein entsprechendes Tool sagt: Dieser Text wurde nicht exakt abgeschrieben. Wie in der Schule früher, wenn man versucht hat, „intelligent“ vom Nachbarn abzuschreiben, sodass es der Lehrer nicht merkt.
In vielen Fällen bemerkt Google bereits heute, dass Menschen sich für einen Text aus bereits vorhandenen Texten bedient haben. Ein gutes Ranking unterbleibt dann regelmäßig, und das zu Recht. Niemand will in den zehn Suchergebnissen essenziell die gleichen Informationen haben. Im Gegenteil: Variationen, andere Blickwinkel, neue Vor- oder Nachteile, erklärende Illustrationen usw. sind sehr viel nützlicher.
Sind Text-KIs die neuen Textagenturen?
Vom Grundprinzip her macht eine KI genau das Gleiche wie eine Textagentur. Hat diese keine eigenen Experten für jede Branche und jede Frage, greifen sie bzw. die angestellten oder freien Mitarbeiter auf Textbestände zurück, die Menschen bereits erzeugt haben – auf Websites, in Büchern, Studien etc. Die KI arrangiert den aus diesem Pool bestehenden Text neu, mit völlig anderen Worten, aber im Kern wird zumindest bisher nicht wirklich neues Wissen bzw. neue Informationen erzeugt.
Das geht auch gar nicht, dazu sind die Maschinen auf absehbare Zeit noch nicht in der Lage. Ein Profiangler kann aus der Erfahrung heraus Tipps geben, die sich eine Maschine nicht einfach so ausdenken kann. Versucht sie es, kommt zumindest bisher in der Regel nur Unsinn, der aus der willkürlichen Zusammenstellung von Details besteht, heraus.
Schreibt der Profiangler neue Tipps in seinen Blog, kann eine Suchmaschine erkennen, dass es hier neue Aspekte gibt. Der Blog hätte ein gutes Ranking verdient, oder? Er spendet Mehrwert für Suchende. Wenn nun genügend andere diese neuen Informationen aufgreifen (statistische Relevanz), kann es durchaus ein, dass sich dann auch eine KI diese Textabschnitte mit einverleibt und diese künftig mit ausgeben kann. Aber: Es gibt diese Infos schon, der Blog hat sein verdientes Ranking, und wenn man ehrlich wäre, braucht niemand weder eine und schon gar nicht mehrere Seite(n), auf denen dies nochmals und nochmals und nochmals aufgekocht wird.