Neuestes Heft: Jetzt bestellen!

UTOPIE Verkehrswende
UTOPIE Verkehrswende

Zehn KI-Texte sind dümmer als fünf! 

Die Büchse der Pandora ist offen – mehr als ein Jahr nach der endemischen Ausbreitung der Nutzung ver­schie­dener Formen der „Künstlichen Intelligenz“ sind erste Ergebnisse zu sehen. Sie sind furchtbar. Noch hat keine Superintelligenz die Macht übernommen oder der Menschheit den Krieg erklärt. Die Auswirkungen sind kein großer Knall, sondern eher ein schleichendes, stetig schlimmer schadendes Siechtum.

Besen, Besen! Seid’s gewesen!“ heißt es im Zauberlehrling, einer von Goethes berühmten Bal­laden. Der Versuch, aus wildgewordenen Wasserschleppern wieder inaktive, eckstehende Kehrgerätschaften zu machen, misslingt dem Azubi der schwarzen Künste schmählich. „Herr und Meister! hör’ mich rufen!“ Erst ein Wort des bange herbei­gesehnten Nigro­manten-Magisters bewirkt ebendies. Vielleicht sind wir, was KI angeht, gerade genau in dieser Lage. Nur, wo bleibt der rettende Meister?

Selbstverständlich sind zehn KI-generierte Texte dümmer als fünf

„Zehn Deutsche sind dümmer als fünf“, sagte Heiner Müller.

Oder war es: „Natürlich sind zehn Deutsche dümmer als fünf Deutsche“?

Oder etwa: „Zehn Deutsche sind natürlich dümmer als fünf Deutsche“?

Und war es überhaupt Heiner Müller?

Deutsche hören diesen Satz verständ­licherweise nicht so gern, vielleicht weil sie vergessen, dass er genauso für Franzosen, Engländer, Italiener und eigentlich jede ­Menschengruppe gilt. Der Satz ist ein beißender Kommentar zur sogenannten Schwarm­intelligenz, die vor einigen Jahren „gehypt“ wurde. Was Heiner Müller aller­dings nicht mehr erlebt hat, er verschied 1995. Ihn kann man also nicht mehr fragen, was genau er gesagt hat.

Aber das rauszukriegen, sollte auf dem Weg ins digitale Zeitalter doch ein Kinderspiel sein! Es steht doch im Internet! Also mal nachgeschaut bei Startpage, bei Ecosia und bei Yandex, um die Daten dreier großer Suchmaschinen zu bekommen: Startpage liefert die Daten von Google, Ecosia die von Bing, beide allerdings datenschützend, das heißt ohne die Daten der Nutzer an die Suchmaschinen weiterzugeben. Für die russische Suchmaschine Yandex gibt es solch einen Anonymisierungsfilter meines Wissens nicht.

Die Suchmaschinen sind vermüllt

Auf die Sucheingabe „zehn Deutsche dümmer fünf Deutsche“ sind die Ergebnismengen sehr ähnlich. Verschiedene Treffer, darunter einige aus den Medien und immer Zitatensammlungen, die Heiner Müllers Diktum in unterschiedlichen Versionen (wie oben genannt) liefern. Nirgendwo eine Quellenangabe.

Man erkennt: Für Suchmaschinen spielt die Frage, was Heiner Müller wirklich gesagt hat, keine Rolle. Sie spiegeln nur, was irgendwer im Netz publiziert hat. Keine Suchmaschine bietet die Möglichkeit, die Ergebnismengen nach Publikationsdatum zu ordnen.

Die Suchmaschinen sind vermüllt – ihre Algorithmen scheitern daran, aus der Menge der Treffer im Netz die wirklich relevanten auszuwählen. Und wie gesagt: bedauer­licherweise keine Quellenangaben.

Eine Ausnahme ist Wikiquote. Die Zitatensammlung ist ein „Schwesterprojekt“ der bekannten Wikipedia und hat sich eben auf das Sammeln von Zitaten spezialisiert. Allerdings nennt die von Startpage angezeigte Seite „Diskussion: Heiner Müller“ als „Quelle“ einen Artikel von Bernd Ulrich, der am 24. Februar 2005 in der Wochenzeitung „Die Zeit“ erschien. Er ist betitelt mit „Richtig gut gewählt: Mit der Niederlage in Schleswig-­Holstein ist die rot-grüne Strategie der Untätigkeit gescheitert“ und beginnt mit den Worten „Heiner Müller hat einmal gesagt: ‚Natürlich sind zehn Deutsche dümmer als fünf Deutsche.‘ Natürlich ist das ein dummer Spruch und ein undemokratischer dazu.“

Das ist mal eine tolle Quellenangabe. Nämlich gar keine! Bernd Ulrich hat in einem „Zeit“-Artikel (zu einem völlig anderen Thema!) geschrieben: „Heiner Müller hat einmal gesagt …“ Das ist ein Pseudonachweis, etwas, das in Wiki-Projekten leider häufig vorkommt und auch geduldet wird. Will sagen: Nachdem jemand diesen nicht belastbaren Pseudobeleg in Wikiquote geschrieben hat, fand sich niemand, der den Unsinn schnell wieder gelöscht hätte – offenbar sind zwei Wikiquote-Schreiber dümmer als einer!

Verschiedene Suchmaschinen werben damit, mit KI zu arbeiten

Neben den algorithmisch arbeitenden Suchmaschinen findet man auch in der semantisch (mit menschlicher Intelligenz) funktionierenden Wikipedia und ihren Schwesterprojekten nichts Belastbares. Das ist wirklich bedauerlich.

Auch ein Blick in eine Pressedatenbank wie Genios hilft nicht. Das Zitat taucht erwartbar häufig in verschiedenen Formen in der Presse auf, Quellenangaben fehlen. Journalistische Arbeit ist hier nicht unbedingt sorgfältiger als das Allerweltpublizieren im Netz.

Und jetzt schlägt die Stunde der Künstlichen Intelligenz. Verschiedene Suchmaschinen werben damit, mit KI zu arbeiten, darunter auch neu entstandene. Allerdings sagt keine, wie genau das funktionieren soll – vermutlich ist auch viel Marketing mit dabei. Zum Beispiel bietet die von Microsoft betriebene Suchmaschine Bing mittlerweile einen Copilot an, hinter dem sich ChatGPT 4 verbirgt, an dessen Betreiberfirma ist Microsoft beteiligt. Bing ist eine gute, empfehlenswerte Suchmaschine, aber ihr weltweiter Marktanteil liegt bei nur etwa drei Prozent – gegenüber circa neunzig Prozent von ­Google. KI markiert hier sicher auch den Versuch, das zu ändern.

Vor einer Anfrage muss man den ­„Unterhaltungsstil auswählen“, und zwar zwischen „im höheren Maße kreativ“ oder „ausgewogen“ oder „genau“, was vermutlich die Faktentreue meint.

Wie auch immer: Auf die Eingabe „Wann und wo hat Heiner Müller den Satz ‚Natürlich sind zehn Deutsche dümmer als fünf Deutsche‘ gesagt oder geschrieben?“ und der Bitte um eine „im höheren Maße genaue“ Antwort erfolgt ein Volltreffer.

„Heiner Müller hat diesen Satz als lakonischen Kommentar zur deutschen Wiedervereinigung von 1990 geäußert. Es wurde 1992 in ‚Gesammelte Irrtümer 3‘ auf Seite 158 gedruckt. Es lässt sich auch als ironische Spitze gegen das ‚demokratische‘ Medium Internet interpretieren“, lautet die Ausgabe. Es wird als Quelle auf einen Artikel von Carmen Tregge verlinkt, der am 27. Mai 2009 auf dem Journalismusportal „das Dossier“ erschien, darin der Hinweis auf Band 3 der „Gesammelten Irrtümer“ von Heiner Müller.

Das Internet wird gerade geflutet von KI-generierten Inhalten

Das ist bemerkenswert. Der Text von Carmen Tregge ist bei „das Dossier“ nicht hinter einer Paywall erschienen, sondern frei abrufbar. Mithin ist es sehr wahrscheinlich, dass alle oben genannten Suchmaschinen die Website „gecrawlt“, also durchsucht haben. Zumal die entsprechende robots.txt (eine Datei, die den Zugriff durch Suchmaschinen beschränken kann) keinerlei Hindernisse enthält.

Eine nachprüfende Recherche mit dem Site Operator ergab, dass Google, Bing (folglich auch Ecosia) und Yandex die Seite kennen (sonderbarerweise kennt Startpage sie allerdings nicht).

Während dieser hilfreiche Treffer also wahrscheinlich in den Ergebnismengen aller Suchmaschinen (inklusive Bing) irgendwo weit hinten unter unbrauchbaren Links versteckt ist, gelingt es dem Copiloten, ihn zu identifizieren und zu präsentieren. Das ist ein echter Fortschritt.

Aber vielleicht war auch einfach Glück dabei, dass der Volltreffer eben ein von einem Menschen verfasster Text ist. Das wird nicht immer so bleiben. Das Internet wird gerade geflutet von KI-generierten Inhalten.

Zum Teil sind das widerliche Straf­taten, wie Deepfake-Pornos beispielsweise. Das sind Pornobilder oder -videos, bei denen Gesichter unbeteiligter Menschen KI-­basiert auf die Körper anderer Menschen übertragen werden, die sich gerade beim Sex filmen lassen. Meist geschieht das ohne deren Zustimmung, und zumeist sind junge Frauen betroffen. Für diese bedeutet das eine enorme Belastung, von der Rufschädigung bis zur psychischen Be­einträchtigung.

Skalierbare Datenanalyse und künstliche Intelligenz

Ein prominentes Opfer ist momentan die Sängerin Taylor Swift. Entsprechende Dateien von ihr kursieren auf 4chan, Telegram und X (Twitter), teilweise millionenfach. X (Twitter) schränkte deswegen die Möglichkeit ein, nach ihr zu suchen. Entsprechende Deepfakes tauchen aber auch in den Ergebnismengen von Google und Bing auf – und zwar bis heute! Es reicht, den Namen der Sängerin um die Suchworte „deepfake“ oder „fake nudes“ zu ergänzen. (Wer’s prüfen will, ohne die Bilder zu sehen, sollte vorher den Safe-Search-Filter scharfschalten.) Es gelingt den Suchmaschinen nicht, solche Inhalte aus ihren Treffermengen herauszuhalten, obwohl klar ist, dass diese gefälscht sind, Straftaten darstellen und Persönlichkeitsrechte massiv verletzen.

Auch in anderen Bereichen versagen die Suchmaschinen beim Aussortieren fragwürdiger, weil minderwertiger Inhalte. So das Ergebnis einer über ein Jahr laufenden Studie von vier Forschern der Universität Leipzig, des dortigen Zentrums für Skalierbare Datenanalyse und künstliche Intelligenz (Scads) und der Bauhaus-Universität Weimar. Titel: „Is Google Getting Worse?“

Sie untersuchten die Ergebnismengen von Google, Bing und Duckduckgo, ­faktisch also einmal Google und zweimal Bing – denn wie sie schreiben: „Although DuckDuckGo claims to utilize many different data sources, we found the results to be extremely similar to Bing.“

Sie untersuchten „die häufige Beobachtung, dass ‚Google immer schlechter wird‘“. Dabei fokussierten sie auf die Suche nach Produktbewertungen. Diese werden gern mit KI erstellt, um mit viel Suchmaschinenoptimierung und Affiliate-Marketing dann in den Suchmaschinen präsentiert zu werden. Der inhärente Interessenkonflikt zwischen Inhaltsanbietern, Suchmaschinen und deren Benutzern liegt dabei auf der Hand.

Sie stellten fest, „dass Seiten mit höherem Ranking im Durchschnitt besser optimiert sind, durch Affiliate-Marketing mehr Geld verdienen und Anzeichen einer geringeren Textqualität aufweisen“. Kurzum: Den Anbietern minderwertiger Texte gelingt es, diese prominent in den Treffer­listen der Suchmaschinen zu platzieren. Ihr Interesse ist klar – mehr Klicks bedeuten mehr Geld und bei Produktbewertungen wohl auch mehr Verkäufe.

Gelingt es den Suchmaschinen, durch Änderungen der Ranking-Kriterien gegenzusteuern? Auch das haben die Forscher untersucht: „Wir stellen fest, dass Suchmaschinen mit ihren Ranking-Updates messbar auf SEO und Affiliate-Spam abzielen. Insbesondere die Updates von Google zeigen eine spürbare, aber meist nur kurzlebige Wirkung.“

Und weiter: „Der ständige Kampf milliardenschwerer Suchmaschinenunternehmen mit gezieltem SEO-Affiliate-Spam sollte als Beispiel dafür dienen, dass die Websuche ein dynamisches Spiel mit vielen Spielern ist, von denen einige schlechte Absichten haben.“ Durch KI haben die Macher mit den schlechten Absichten ein mächtiges Werkzeug in der Hand. Stellen wir uns darauf ein, dass Suchmaschinen noch schlechtere Ergebnisse liefern werden als schon jetzt. Dass zehn KI-generierte Texte dümmer sind als fünf, werden wir erleben.

Ähnliche Beiträge