ChatGPT-Entwickler OpenAI stellt Text-to-Video-KI-Modell Sora vor

OpenAI, ein in den USA ansässiges Forschungs- und Entwicklungsunternehmen für künstliche Intelligenz (KI), hat ein neues KI-Modell namens Sora vorgestellt, das Videos auf der Grundlage von Textanweisungen erstellen kann.

Das Text-zu-Video-KI-Modell wurde entwickelt, um realistische und phantasievolle Szenen zu entwickeln, die bis zu 60 Sekunden dauern. Die Ausgabe behält die visuelle Qualität bei und folgt gleichzeitig den Anweisungen des Benutzers, so OpenAI.

Derzeit hat die von Microsoft unterstützte OpenAI Sora für Red-Teamer zugänglich gemacht, um kritische Bereiche auf Schäden oder Risiken zu untersuchen.

Das KI-Unternehmen wird das Tool auch verschiedenen bildenden Künstlern, Designern und Filmemachern zur Verfügung stellen, um deren Anregungen einzuholen. Dabei geht es darum, wie das neue KI-Modell weiterentwickelt werden kann, um Kreativschaffende optimal zu unterstützen.

Laut OpenAI ist das neue KI-Modell in der Lage, komplexe Szenen mit verschiedenen Charakteren, spezifischen Bewegungstypen und präzisen Details des Motivs sowie des Hintergrunds zu erstellen.

Sora versteht nicht nur die Anforderungen des Benutzers über die Eingabeaufforderung, sondern weiß auch, wie diese Elemente in der physischen Welt existieren.

Außerdem produziert Sora mehrere Aufnahmen in einem einzigen Video, wobei die Genauigkeit bei der Darstellung der Charaktere und des visuellen Stils durchgehend erhalten bleibt.

Außerdem kann das neue KI-Modell ein vorhandenes Standbild nehmen und daraus ein Video erstellen, indem es den Inhalt mit Augenmerk auf kleine Details animiert.

Es kann auch ein bestehendes Video nehmen und es erweitern oder fehlende Bilder ergänzen.

Sora ist ein Diffusionsmodell, das ein Video erzeugt, indem es mit einem Video beginnt, das wie statisches Rauschen aussieht, und es allmählich transformiert, indem es das Rauschen in vielen Schritten entfernt.

Sora ist in der Lage, ganze Videos auf einmal zu generieren oder generierte Videos zu verlängern. Indem wir dem Modell die Vorausschau auf viele Einzelbilder gleichzeitig ermöglichen, haben wir das schwierige Problem gelöst, sicherzustellen, dass ein Motiv gleich bleibt, auch wenn es vorübergehend aus dem Blickfeld verschwindet.

Das KI-Unternehmen gab auch bekannt, dass es Tools entwickelt, die dabei helfen, irreführende Inhalte zu erkennen, wie z. B. einen Erkennungsklassifikator, der feststellen kann, ob ein Video von Sora erstellt wurde.

OpenAI beabsichtigt außerdem, in Zukunft C2PA-Metadaten einzubeziehen, sollte das Modell in ein Produkt integriert werden.