Neuestes Heft: Jetzt bestellen!

35 JAHRE MAUERFALL
35 Jahre Mauerfall

Mit KI natürlich recherchieren 

von Burkhard Schröder

Es ist verführerisch: Man sitzt vor dem Monitor, und es fällt einem nichts ein. Da gab es doch … genau! Wir bitten einfach die Künstliche Intelligenz, einen Artikel zu schreiben und zu recherchieren. Wem würde das auffallen? Da fängt es schon an. Wer einen eigenen, erkennbaren Stil hat, wird den nicht wiederfinden. Und gar Ironie? Die Künstliche Intelligenz ist so humorlos wie ein woker Hipster mit Gendersternchen auf der Zunge. Aber könnten wir das KI-Ergebnis als Vorlage nehmen, also Zeit sparen?

Fragen wir ChatGPT: Welche Inhalte und Themen müsste ein Artikel behandeln, der den Titel trägt „Investigative journalistische Recherche im Internet mit Hilfe von Künstlicher Intelligenz“? Jetzt rasseln gleich die Phrasen wie von einem Sprachblasenfacharbeiter einer Werbeagentur:

Ein Artikel mit dem Titel ‚Investigative journalistische Recherche im Internet mit Hilfe von Künstlicher Intelligenz‘ sollte eine Vielzahl von Themen und Inhalten abdecken, um den Lesern einen umfassenden Überblick über die Anwendung und den Nutzen von KI im Bereich des investigativen Journalismus zu bieten.

Schön, das hätten wir mit natürlicher Intelligenz auch irgendwie erraten. Wolf Schneider würde anmerken: Eine Vielzahl von Themen und Inhalten ist so abgedroschen und inhaltsleer, dass man sich eine halbe Stunde mit der Lektüre von Schillers „Glocke“ (Verben! Verben! Verben!) erholen muss.

Hier sind einige wichtige Punkte, die der Artikel behandeln sollte:

(Genau! Die unwichtigen Punkte behandeln wir ausnahmsweise nicht!)

Einleitung: Definition und Bedeutung des investigativen Journalismus: Erläuterung, was investigativer Journalismus ist und warum er wichtig ist. Einführung in Künstliche Intelligenz (KI): Grundlegende Erklärung von KI und deren allgemeine Anwendungen.

Hier schon wenden sich die ersten Leser mit Grauen ab und den unterhaltsameren sozialen Medien zu. Journalisten, die erläutern, warum Journalismus wichtig ist – das klingt so, als gäbe es Journalisten, die sich gegenseitig Preise verleihen – wie albern ist das denn? (Sorry, falls jemand hier einen Journalistenpreis bekommen hat.)

Anwendungsbereiche der KI im investigativen Journalismus

  • Datenanalyse: Wie KI große Datenmengen analysieren und Muster erkennen kann, die menschliche Journalisten möglicherweise übersehen würden.
  • Automatisierung von Routineaufgaben: Einsatz von KI zur Automatisierung von Aufgaben wie Datenreinigung, Transkription von Interviews und Übersetzungen.
  • Textanalyse und -verarbeitung: Verwendung von Natural Language Processing (NLP) zur Analyse und Interpretation von Texten, Dokumenten und sozialen Medien.
  • Bild- und Videoanalyse: Einsatz von KI zur Analyse und Verifizierung von Bildern und Videos, einschließlich Gesichtserkennung und Objekterkennung.

Das akzeptieren wir, zumal Journalisten, die zugeben, dass sie etwas übersehen können, schon weitaus selbstkritischer sind als die Mehrheit der Zunft. Aber was genau ist gemeint? Im Sinn: Wir fragen die KI gleich noch einmal.

Vorteile und Nutzen

  • Effizienzsteigerung: Wie KI die Effizienz und Produktivität von Journalisten steigern kann.
  • Erweiterung der Recherchemöglichkeiten: Neue Möglichkeiten und Perspektiven, die durch KI eröffnet werden.
  • Verbesserung der Genauigkeit: Erhöhung der Genauigkeit und Zuverlässigkeit von Recherchen durch die Analyse großer Datenmengen und das Erkennen von Fehlern oder Unstimmigkeiten.

Das, ChatGPT, ist, mit Verlaub, Gelaber. Effizienz, um den tendenziellen Fall der Profitrate des Kapitals aufzuhalten? Oder mehr Zeit für den Nachwuchs zu haben, der sich per Smartphone online mit Künstlicher Intelligenz beschäftigt? Mehr Produktivität bei gleicher Bezahlung – wo kämen wir denn da hin?! Neue Möglichkeiten und Perspektiven, vergleiche Vielzahl von Themen und Inhalten – zertrümmere die Sprechblasen der alten Unmöglichkeiten und Sichtweisen!

Danach listet ChatGPT die Herausforderungen und Risiken auf – die dürfen auf keinen Fall fehlen und sind überall, auch wo man sie nicht erwartet, etwa bei Grabrednern: Der Tod als Herausforderung und Risiko. Den Abschnitt lassen wir ganz weg.

Erfolgreiche Projekte: Beispiele von investigativen Recherchen, die durch den Einsatz von KI erfolgreich waren.

Das hört sich spannend an. ChatGPT: Nenne Beispiele von investigativen Recherchen, die durch den Einsatz von KI erfolgreich waren!

Es gibt mehrere bemerkenswerte Beispiele, bei denen Künstliche Intelligenz (KI) erfolgreich in investigativen Recherchen eingesetzt wurde:

Panama Papers: 2016 deckten die Panama Papers ein komplexes Netzwerk von Offshore-Konten und Briefkastenfirmen auf, die von Politikern, Prominenten und Geschäftsleuten genutzt wurden. Einsatz von KI: Das International Consortium of Investigative Journalists (ICIJ) nutzte KI-gestützte Tools, um Millionen von Dokumenten zu durchsuchen und Verbindungen zwischen verschiedenen Entitäten zu erkennen. Diese Tools halfen dabei, Muster und Netzwerke zu identifizieren, die sonst schwer zu entdecken gewesen wären.

Paradise Papers: Hintergrund: 2017 wurden die Paradise Papers veröffentlicht, die ähnliche Offshore-Finanzstrukturen wie die Panama Papers aufdeckten. Einsatz von KI: Auch hier setzte das ICIJ KI-Technologien ein, um die Daten zu analysieren und Verbindungen aufzudecken. Diese Technologie ermöglichte es, große Mengen unstrukturierter Daten effizient zu durchsuchen und relevante Informationen zu extrahieren.

Project Daphne: Nach dem Mord an der maltesischen Journalistin Daphne Caruana Galizia setzten Journalisten KI ein, um ihre investigativen Arbeiten fortzusetzen. Einsatz von KI: KI-Tools halfen dabei, große Mengen an Dokumenten, E-Mails und anderen Datenquellen zu analysieren, die sie gesammelt hatte. Dadurch konnten Verbindungen und Verdächtige identifiziert werden, die zur Aufklärung des Falls beitrugen.

Investigative Data Mining bei Bloomberg: Bloomberg News nutzt fortschrittliche KI-Algorithmen, um verdächtige Handelsaktivitäten und Marktmanipulationen zu erkennen. Einsatz von KI: Durch den Einsatz von Machine Learning und Datenanalysetechniken konnten Muster in Handelsdaten entdeckt werden, die auf illegale Aktivitäten hinwiesen. Dies führte zu mehreren aufsehenerregenden Berichten über Marktmanipulation.

Human Rights Investigations:  KI-gestützte Bild- und Videoanalyse-Tools werden verwendet, um Beweise für Kriegsverbrechen und andere Menschenrechtsverletzungen zu sammeln und zu verifizieren. Diese Technologien helfen, große Mengen an visuellem Material schnell zu durchsuchen und relevante Beweise zu identifizieren. Tools und Technologien: Vorstellung spezifischer KI-Tools und -Plattformen, die im investigativen Journalismus genutzt werden (zum Beispiel IBM Watson, Google Cloud AI etc.).

Das müssen wir uns näher anschauen – warum sollte man den Tipps der Künstlichen Intelligenz glauben, zumal niemals herauszufinden sein wird, woher diese stammen und ob irgendjemand das überprüft hat?

  1. Google Cloud Natural Language API:Ein Tool von Google, das Textanalysen und NLP-Funktionen wie Entitätsidentifikation, Stimmungsanalyse und Syntaxanalyse bietet.

https://cloud.google.com/natural-language/docs?hl=de

Nachfragen an ChatGPT:

Natural Language Processing (NLP) umfasst eine Reihe von Funktionen und Techniken, die es Computern ermöglichen, menschliche Sprache zu verstehen, zu interpretieren und darauf zu reagieren. Und: Die Entitätsidentifikation, auch bekannt als Named Entity Recognition (NER), ist eine zentrale Funktion im Bereich des Natural Language Processing (NLP). Sie umfasst die Erkennung und Klassifizierung von Entitäten (also spezifischen Informationseinheiten) in Texten.

Man kann das Tools kostenlos testen. Aber warum sollte man für etwas bezahlen, was man selbst besser kann? Vielleicht könnte das virtuelle Werkzeug etwas für Kriminalisten sein, die sich bei fremdsprachlichen Texten, wie zum Beispiel Indonesisch oder Chinesisch, einen ersten Eindruck verschaffen können, womit sie es zu tun haben. Ein Freiberufler kann sich die Kosten vermutlich nur selten leisten. Hier ist natürliche Intelligenz preiswerter.

Und wenn die Künstliche Intelligenz unstrittig Ironie und Sarkasmus nicht versteht – wie kann sie dann richtig interpretieren oder gar reagieren? Nur zu, Künstliche Intelligenz! Welche Entität identifizierst du hier – und wie reagierst du? „An einem Juni-Morgen des Jahres 1872 erschlug ich meinen Vater – eine Tat, die damals tiefen Eindruck auf mich machte.“ (Ambose Bierce: An Imperfect Conflagration) Tipp: Damals?

Diese Einwände gelten auch für

  1. IBM Watson Natural Language Understanding: Ein KI-Tool von IBM, das NLP-Funktionen wie Schlüsselwortextraktion, Entitätsidentifikation und Sentimentanalyse ermöglicht.

https://www.ibm.com/products/natural-language-understanding

  1. OpenAI GPT-3:Eine leistungsstarke KI-Plattform, die Sprachgenerierung und -analyse ermöglicht. Es kann verwendet werden, um Fragen zu beantworten, Texte zu verstehen und sogar kreative Inhalte zu generieren.

Da muss ich widersprechen, ChatGPT! Die Version 4.0 deiner selbst ist bei vielen Informationen um Klassen besser als die älteren Varianten. Das wird sich noch weiter verbessern – aber die grundsätzlichen Probleme sind damit nicht aus der Welt. Kreativ ist das alles nicht, auch wenn wir das Buzzword „kreativ“ durch „schöpferisch“ ersetzen, damit wir nicht immer an Volkshochschulkurse denken müssen.

  1. Maltego („The World’s Most Used Cyber Investigation Platform“):Ein Open-Source-Tool für die Informationsgewinnung und Datenvisualisierung, das bei der Analyse von Beziehungen zwischen Personen, Organisationen und anderen Entitäten hilft. https://www.maltego.com/

Nachfrage an ChatGPT: Erkläre, wie die Software Maltego zum Analysieren von Daten funktioniert!

Datenakquisition (Transformen): Maltego verwendet sogenannte „Transformen“, um Daten aus verschiedenen Quellen zu sammeln. Diese Transformen sind vordefinierte Skripte, die bestimmte Arten von Informationen abrufen können. Beispiele: Transformen können verwendet werden, um Informationen wie Domain-Namen, IP-Adressen, soziale Medienprofile, E-Mail-Adressen, Telefonnummern und vieles mehr zu extrahieren.

Datenvisualisierung: Die gesammelten Daten werden in Form von Graphen visualisiert. Diese Graphen zeigen Entitäten (Datenpunkte) und deren Verbindungen (Beziehungen) zueinander. Beispiele: Ein typischer Graph kann die Beziehung zwischen einer IP-Adresse und den dazugehörigen Domain-Namen, E-Mail-Adressen und sozialen Medienprofilen darstellen.

Interaktive Analyse: Benutzer können die Graphen interaktiv erkunden, indem sie auf einzelne Entitäten klicken, um detaillierte Informationen anzuzeigen, oder neue Transformen anwenden, um zusätzliche Daten zu sammeln. Beispiele: Durch Klicken auf eine E-Mail-Adresse kann der Benutzer Transformen anwenden, um zu sehen, welche sozialen Medienprofile mit dieser E-Mail-Adresse verknüpft sind.

Maltego macht das, was Google und Facebook auch tun: Alle Daten, die Nutzer öffentlich im Internet hinterlassen, zu sammeln, zu ordnen und sogar zu visualisieren. Das konnten versierte Rechercheure vorher auch schon, wenn man weiß, was Tracerouting ist oder wie man zum Beispiel Nutzerprofile erstellt – sogar im Usenet (die KI kann das Usenet nicht indizieren) –, wie man den Inhaber von Domains und Subdomains herausfindet und wie man IP-Adressen zuordnet. Bisher war das aber eine mühselige Puzzlearbeit und wird durch Maltego erleichtert.

Bonus: Die Software kann, sogar für das Betriebssystem Linux, heruntergeladen und gratis verwendet werden. Die kostenpflichtige Version bietet erheblich mehr Features.

Nachfrage an ChatGPT: Gibt es kostenlose Software, die die Beziehungen von Nutzern sozialer Medien visualisieren kann?

Gephi https://gephi.org

NodXL https://nodexl.com

SocNetV (Social Networks Visualizer): https://socnetv.org

Netlytic https://netlytic.org

Pajek http://mrvar.fdv.uni-lj.si/pajek

  1. TensorFlow: Eine Open-Source-Maschinenlernbibliothek, die es Benutzern ermöglicht, eigene KI-Modelle zu entwickeln und anzupassen, um spezifische Rechercheziele zu erreichen.

https://www.tensorflow.org

Hier müssen wir passen: Die Software selbst zu programmieren und den eigenen Bedürfnisse anzupassen, ist nur etwas für Leute, die bei der Zeile model.compile(optimizer=‘adam‘, loss=‘sparse_categorical_crossentropy‘ verständnisvoll mit dem Kopf nicken. Das gilt auch für

  1. Scrapy:Ein Python-Framework für das Web-Scraping, das es Benutzern ermöglicht, strukturierte Daten aus Websites zu extrahieren. https://scrapy.org/
  2. Hunchly („Automatic Preservation of Websites and Social Media“): Eine Software für die Webseiten- und Quellenverfolgung, die es Journalisten ermöglicht, ihre Recherchen zu dokumentieren und Webseiten automatisch zu archivieren.

https://www.hunch.ly/ (Abonnement ab ca. 110 $ jährlich)

Hier hat ChatGPT selbständig die Frage erweitert und verändert. Für freie Journalisten zu teuer, zumal Dokumentation oder automatisches Speichern von Websites auch anders zu bewerkstelligen sind.

  1. InVID Verification Plugin– eine Browsererweiterung, die von Journalisten verwendet wird, um die Echtheit von Bildern und Videos zu überprüfen und Metadaten zu analysieren.

https://tinyurl.com/2s384ury (Chrome Store)

Überflüssig und nur für den Browser Chrome. Jedes einigermaßen anspruchsvolle Grafikprogramm kann zum Beispiel die EXIF-Daten eines Fotos auslesen.

  1. Bellingcat Online Investigation Toolkit:Ein Toolkit für Online-Recherchen, das verschiedene Ressourcen und Tools für OSINT und Social Media-Verifikation bietet.

https://tinyurl.com/629shaf9 vgl. https://counteringdisinformation.org/index.php/interventions/bellingcat-online-investigation-toolkit

Vergleiche auch „These are the Tools Open Source Researchers Say They Need“ https://www.bellingcat.com/resources/2022/08/12/these-are-the-tools-open-source-researchers-say-they-need/

Bellingcat mit Sitz in Amsterdam (NL) ist laut Wikipedia ein nicht-staatliches investigatives Recherchenetzwerk um den Netzaktivisten Eliot Higgins, das sich auf den Faktencheck und Open Source Intelligence (OSINT) spezialisiert. Die Organisation und die ihr manchmal vorgeworfene Regierungsnähe wären ein eigenes Kapitel wert. Die Berliner Zeitung warf Bellingcat zum Beispiel vor, sie habe „Satellitenfotos falsch datiert und verändert“.

https://www.berliner-zeitung.de/politik-gesellschaft/bellingcat-analyse-in-der-kritik-krieg-der-bilder-li.14300

  1. Yandex Translate API:Eine KI-basierte Übersetzungsschnittstelle, die es ermöglicht, fremdsprachige Informationen zu verstehen und zu analysieren.

Ein Ableger der russischen Suchmaschine Yandex, der angibt, in Serbien beheimatet zu sein, und zuerst die IP-Adresse ausliest, um die Sprache des Nutzers einzustellen – was aber nicht funktioniert (error 404). Merke: Putin liest vermutlich mit.

  1. Datawrapper:Ein Tool für die Erstellung von interaktiven Grafiken und Diagrammen, um Daten und Ergebnisse visuell darzustellen.

https://www.datawrapper.de/

Sehr nützlich, wenn man bei der Frage „Wie möchtest du deine Daten hochladen?“ nicht schon zusammenzuckt.

  1. Storyful Open-Source Intelligence (OSINT) Toolkit:Ein Toolset für Journalisten zur Überwachung und Analyse von Social-Media-Plattformen und anderen öffentlichen Quellen. „Storyful Intelligence provides a consultative approach to strategic planning, uncovering emerging trends, narratives and influencers across digital platforms to gain competitive advantage in campaign planning, product launches, personnel changes and more.

Fazit: Recherchieren kann Künstliche Intelligenz nicht. Das war zu erwarten. Auch die Tools für die Online-Recherche, die etwa ChatGPT 4.0 aufführt, sind nicht vollständig. (Vergleiche „Die 10 besten Open-Source-Intelligence-(OSINT)-Tools“ https://unite.ai/de/Beste-Open-Source-Intelligence-Osint-Tools/).

Um sich einen ersten Überblick zu verschaffen und Zwischenfragen (wie funktioniert …?) beantworten zu lassen, eignet sich die KI hervorragend und ist hier besser und schneller als Wikipedia.

Ähnliche Beiträge