Auf der Plattform "Chatbot Arena" vergleichen Nutzer anonymisierte KI-Systeme. Zwei neue Modelle – Zenith und Summit – stachen dabei hervor. Die Antworten waren konsistent, stilistisch ausgefeilt und bei Denkaufgaben präzise. Mehrere Nutzer berichteten, sie schnitten bei literarischen Aufgaben, Alltagsrätseln oder beim Programmieren besser ab als GPT-4o, Claude 4 und sogar Grok 4.
Die Community war sich ziemlich sicher: Das sind Test-Modelle von GPT-5.
In einem Beispiel programmierte das Modell Zenith im ersten Anlauf eine komplexe Webseite.
Andere Prompts wie "Schreib eine Kurzgeschichte über KI und Trauer" produzierten Resultate, die mehrere Nutzer als menschlich, witzig und überraschend kreativ bezeichneten. Kritik gab es ebenfalls: Zenith sei manchmal zu "gesprächig", Summit halte sich zu streng an Vorgaben.
Vergangenen Sonntag wurden die beiden Modelle Zenith und Summit von der Plattform entfernt. Für Kenner ein eindeutiges Zeichen: Die Veröffentlichung von GPT-5 steht unmittelbar bevor.
Sam Altman, Chef von OpenAI, erhielt eine E-Mail mit einer Frage, die er nicht verstand. Also gab er sie ins neue Sprachmodell ein. "GPT-5 beantwortete sie perfekt", sagte Altman im Juli im US-Podcast "This Past Weekend" von Komiker Theo Von. "Ich lehnte mich zurück und dachte: Oha, das ist es also. Ich fühlte mich richtig nutzlos im Vergleich zur KI."
Laut Berichten von The Verge soll GPT-5 nicht ein einzelnes Modell sein, sondern eine Kombination spezialisierter Teilsysteme. Es soll besser schreiben, präziser denken und sich sicherer ausdrücken – in Alltagsthemen wie bei komplexen Aufgaben. Der Start wird für August erwartet.