Die Firma xAI hat eine neue Version ihrer künstlichen Intelligenz vorgestellt. Grok 4 soll in vielen Disziplinen besser abschneiden als Menschen – auch bei komplexen Aufgaben. Die Entwickler sprechen von einem Meilenstein.
"Grok 4" besteht akademische Tests wie den Scholastic Assessment Test (SAT) oder Graduate Record Examination (GRE) mit Bestnoten. Neben der Standardversion bietet xAI auch "Grok 4 Heavy" an – eine Variante mit deutlich mehr Rechenleistung.
Dabei arbeiten mehrere KI-Agenten gleichzeitig an derselben Aufgabe. Sie vergleichen ihre Lösungen und einigen sich auf das beste Ergebnis. Laut xAI löst "Grok 4 Heavy" so rund 44,4 Prozent der Fragen eines besonders schwierigen Tests korrekt (Humanity's Last Exam) – deutlich mehr als die Konkurrenz. Das nächstbeste Modell ist Gemini 2.5 Pro mit 21,6 Prozent, gefolgt von OpenAIs o3 mit 20,3 Prozent.
Was ist "Humanity's Last Exam"?
"Humanity’s Last Exam" (die letzte Prüfung der Menschheit) ist ein extrem anspruchsvoller Test, der entwickelt wurde, um die Grenzen aktueller KI-Systeme auszuloten. Er wurde vom Center for AI Safety (CAIS) und Scale AI ins Leben gerufen und umfasst 3.000 Fragen aus über 100 Fachgebieten wie Mathematik, Naturwissenschaften, Geisteswissenschaften und Informatik. Die Fragen wurden von Fachleuten aus mehr als 500 Institutionen weltweit erstellt.
Was macht den Test so besonders?
Höchster Schwierigkeitsgrad: Die Fragen erfordern tiefgehendes Fachwissen und komplexes logisches Denken.
Multimodale Aufgaben: Neben Fragen in Textform gibt es Aufgaben mit Bildern, Diagrammen und anderen Formaten.
Strenge Bewertung: Die meisten Fragen haben eindeutige, überprüfbare Antworten, um die Leistung objektiv zu messen.
Diese Version ist im neuen Abo für 300 Dollar pro Monat erhältlich und richtet sich vor allem an Anwendungen mit hoher Komplexität, etwa in Forschung, Simulation oder Prognose.
In einer Wirtschaftssimulation leitete Grok 4 den Betrieb von Verkaufsautomaten. Die KI koordinierte Lager, Bestellungen und Preise. Laut Anbieter erzielte sie einen höheren Gewinn als andere Modelle. In der Forschung filterte sie aus Millionen Datensätzen eine als besonders relevant eingestufte Hypothese heraus – deutlich schneller als konventionelle Methoden.
Elon Musk rechnet damit, dass Grok 4 bald neue Technologien entwickelt. Möglich seien auch Entdeckungen in der Physik. Entscheidend sei, ob diese Ideen in der Realität bestehen – also nützlich und umsetzbar sind.
Langfristig soll Grok mit der echten Welt interagieren: über Roboter, die Hypothesen testen, Maschinen bauen oder Medikamente entwickeln.
Grok 4 hat laut den Entwicklern noch Schwächen. Die Bild- und Videoanalyse ist noch ausbaufähig. Eine neue Version mit besseren Sehfähigkeiten ist bereits in Arbeit und in den kommenden Wochen einsatzbereit.
xAI-Gründer Elon Musk betont das Potenzial der Technologie, verweist aber auch auf die Verantwortung. Man müsse künstlicher Intelligenz "die richtigen Werte mitgeben", sagte er – etwa Wahrhaftigkeit, Anstand und "Ehrenhaftigkeit", wie man sie auch einem Kind vermitteln wolle, das eines Tages große Macht habe.
„Ich denke, es wird gut für die Menschheit sein – höchstwahrscheinlich“Elon Musk
Die Entwickler sprechen von einer "Intelligenzexplosion". Grok sei nur der Anfang – das Tempo werde weiter zunehmen. Die Menschheit stehe am Beginn einer neuen Ära.
Elon Musk sagte an der Präsentation: "Ich denke, es wird gut für die Menschheit sein – höchstwahrscheinlich. Aber selbst, wenn nicht: Ich möchte wenigstens dabei sein, wenn es passiert."