Eine Taube gurrt, ein Lastwagen hupt – und zwei Figuren unterhalten sich. Was wie eine Filmszene wirkt, stammt komplett aus der Maschine. "Veo 3", Googles bisher fortschrittlichstes Videosystem, erstellt nicht nur Bilder – sondern auch Tonspuren mit Umgebungsgeräuschen und echten Dialogen.
Die Szenen basieren auf kurzen Texteingaben. Daraus macht die KI komplette Videosequenzen, oft mit verblüffend natürlicher Geräuschkulisse und sprechenden Charakteren.
Wer selbst kreativ werden will, nutzt die neue Anwendung "Flow".
Mit "Flow" bietet das Technologieunternehmen Google ein digitales Filmstudio für alle, die eigene Ideen umsetzen möchten. Die Anwendung kombiniert verschiedene KI-Systeme – für Bild, Sprache und Video – und ermöglicht gezieltes Storytelling per Texteingabe.
Nutzer steuern Kamera, Figuren und Bildaufbau, passen Stimmung oder Handlung an – und inszenieren eigene Geschichten mit wenigen Sätzen. "Flow" richtet sich an Content-Creators – erhältlich für zahlende Nutzerinnen und Nutzer im Google-KI-Abo.
Je realistischer Inhalte aus der Maschine wirken, desto größer das Risiko für Fälschungen. Hier setzt Google auf "SynthID" – ein System, das unsichtbare Wasserzeichen in KI-generierte Videos, Bilder und Text einbettet.
Mehr als zehn Milliarden Inhalte sind laut Google bereits markiert. Neu prüft ein Online-Portal, ob ein Wasserzeichen enthalten ist – und in welchen Szenen.
Mit "Gemini Ultra" bietet Google ein neues Abo für alle, die auf die leistungsfähigsten Funktionen zugreifen wollen. Enthalten sind früher Zugang zu "Veo 3", die Anwendung "Flow" sowie weitere Features für Kreative, Forschungsteams und Programmierer. Die Kosten belaufen sich auf stolze 250 Dollar pro Monat.
Der preisgekrönte Filmemacher Dave Clark hat nach dem Release von "Veo 3" die ganze Nacht durchgearbeitet, um diesen kinoreifen Filmausschnitt zu generieren:
Zunächst gibt es Gemina Ultra nur in den USA. Wann es für den Rest der Welt verfügbar wird, hat Google noch nicht verraten.
Mit "Veo 3" erreicht künstliche Intelligenz im Videobereich eine neue Stufe: Erstmals spricht sie selbst – mit Geräuschen, Musik, Stimmen und echten Gesprächen. Wer kreativ werden will, setzt mit "Flow" eigene Videoideen um. Und dank "SynthID" bleibt klar, was echt ist – und was KI gemacht hat.