OpenAI-Helfer

ChatGPT Agent erledigt selbstständig Aufgaben für dich

Der neue ChatGPT Agent führt Aufgaben direkt im Web autonom aus. Dieses experimentelle Feature birgt aber Sicherheitsrisiken.
23.07.2025, 11:30
Loading...
Angemeldet als Hier findest du deine letzten Kommentare
Alle Kommentare
Meine Kommentare
Sortieren nach:

Kommentare neu laden
Nach oben

ChatGPT Agent kombiniert bisher getrennte Werkzeuge wie Websuche, Deep Research und den Browser-Agenten "Operator". Der Agent verfolgt selbstständig Ziele: Er recherchiert Inhalte, analysiert Daten, erstellt Tabellen und bereitet Buchungen vor. Alle Prozesse laufen, unabhängig vom eigenen Gerät, über einen virtuellen Rechner in der Cloud und bleiben aktiv, auch wenn der Tab geschlossen wird.

Was ist ein KI-Agent?

Ein KI-Agent ist ein digitaler Helfer, der selbstständig Aufgaben erledigen kann. Stell dir vor, du hast eine Aufgabe, zum Beispiel eine E-Mail zu beantworten oder etwas im Internet zu suchen. Normalerweise würdest du das selbst tun. Ein KI-Agent hat die Fähigkeit, dir diese Aufgaben abzunehmen, indem er sie selbständig verstehen, planen und ausführen kann. Er kann zum Beispiel ein Restaurant suchen, gleich eine Reservation in deinem Namen tätigen und diese in deinen Kalender eintragen.

Hier einige Beispiele, welche Aufgaben der Agent bereits erledigen kann:

Einkauf fürs Abendessen: Der Agent meldet sich bei einem Online-Supermarkt an, sucht Zutaten für ein Menü (z.B. Erdäpfel, Karotten, Hühnerfleisch), legt sie in den Warenkorb und überprüft die Bestellung. Für den Kaufvorgang übernimmt der User den Browser.

Das Leben organisieren: Im Beispiel von OpenAI sucht der Agent nach Direktflügen, prüft Mails über Gmail, trägt Termine in Google Calendar ein und berechnet Geschäftsdaten mit Python.

Nicht alle vermelden Positives

Ein User bemängelt vor allem die Geschwindigkeit des Agenten und bezeichnet OpenAIs KI als overhyped und mangelhaft.

Konkurrenzprodukte wie Genspark oder auch Manus liefern mindestens gleich gute Performance, und sind dabei wesentlich schneller.

Der Nachteil: Diese Tools kosten extra. ChatGPT Agent ist im Abo-Preis inbegriffen.

Neue Top-KI von OpenAI

In internen Tests erreichte der Agent laut OpenAI bei der Tabellenprüfung "SpreadsheetBench" eine Genauigkeit von 45,5 Prozent – etwa doppelt so viel wie frühere Systeme.

Bei "Humanity's Last Exam" (einem breiten, anspruchsvollen Wissens-Benchmark) erreichte er mit 44,4 Prozent fast das Doppelte der Leistung früherer Top-Modelle.

Er soll zudem deutlich präziser sein als frühere "Deep Research"-Lösungen.

Was genau ist "SpreadsheetBench"

SpreadsheetBench ist ein fortschrittlicher Test, der die Fähigkeiten von KI, insbesondere von großen Sprachmodellen (LLMs), bei der Bearbeitung von Tabellenkalkulationen bewertet.

Was macht ihn besonders?

Realistische Aufgaben: Die über 900 Fragen stammen aus echten Problemen von Online-Excel-Foren.

Komplexe Dateien: Die Testdateien enthalten vielfältige und realitätsnahe Tabellendaten.

Robuste Bewertung: Die generierten Lösungen werden mit mehreren Testfällen auf ihre Robustheit geprüft.

Aktuell nur für Pro-Konten

Der Zugang ist derzeit auf Pro-Nutzer beschränkt. Team- und Plus-Konten sollen in Kürze folgen. In der EU und der Schweiz ist der Agent noch nicht freigeschaltet, ein Release-Datum ist nicht bekannt.

Bekannte Schwachstellen des Agenten

OpenAI stuft den Agenten als experimentell ein. Eine potenzielle Schwachstelle sind sogenannte "Prompt Injections": Dabei können Webseiten versteckte Befehle enthalten, die der Agent versehentlich ausführt. Zum Beispiel kann der Agent auf einer bösartigen Website aufgefordert werden, deine Kreditkarteninformationen einzugeben.

OpenAI implementiert Schutzmaßnahmen

Laut OpenAI erkennt das System verdächtige Inhalte und fordert bei kritischen Aktionen eine manuelle Freigabe. Der Agent speichert keine Daten zwischen Sitzungen. Passwörter müssen manuell eingegeben werden – sie werden weder gesehen noch gespeichert.

Bei sensiblen Aufgaben kannst du die Handlungen des Agenten in Echtzeit verfolgen und bei Bedarf eingreifen oder die Kontrolle übernehmen. Gerade bei neuen Webseiten ist Vorsicht geboten.

{title && {title} } red,20 Minuten, {title && {title} } Akt. 23.07.2025, 12:03, 23.07.2025, 11:30
Weitere Storys
Jetzt E-Paper lesen