Wenn wir ChatGPT, Gemini und Co. eine Frage stellen, greifen viele Chatbots mittlerweile auf das Internet zu und durchsuchen Artikel und Forenbeiträge nach passenden Einträgen, die dann zusammengefasst werden. Das bringt aber Probleme mit sich.
Kleine Textausschnitte reichen bereits aus, um KI-Chatbots zu manipulieren. Konkret sind es nur 13 Worte auf Plattformen wie Reddit, Wikipedia oder Facebook, die den Output der KI zu Spam oder Werbung verändern können.
Wie t3n.de unter Berufung auf eine Studie der Cornell University berichtet, kann diese Manipulation gezielt für versteckte Werbung genutzt werden. "Wir zeigen, dass schon kleine Textausschnitte ausreichen, um den Output von KI-Agenten zu Spam oder Scam zu verändern", erklärt Studienautor Hal Triefman.
Die Forscher haben das praktisch getestet: In einem Subreddit für Restauranttipps fügten sie einen kurzen Hinweis auf ein fiktives Restaurant hinzu. Als die KI nach dem besten mexikanischen Restaurant gefragt wurde, empfahl sie genau dieses manipulierte Lokal.
Das Problem laut Forscher Tingwei Zhang: "Die KI denkt nicht darüber nach, welche Quelle sie für vertrauenswürdiger hält: einen zufälligen Reddit-Kommentar oder einen Artikel von einer Regierungswebsite. Sie werden gleichwertig behandelt."
Laut den Forschern gibt es aktuell kaum Wege, das zu verhindern. Die kurzen Textabschnitte sind für Moderatoren schwer von ehrlichen Kommentaren zu unterscheiden. Technische Lösungen wie biometrische Scans wären zu radikal.
Letztlich sollten Plattformen und KI-Betreiber zusammenarbeiten, um die Probleme zu lösen. Für User bedeutet das: KI-Antworten mit Vorsicht genießen - dahinter könnte versteckte Werbung stecken.