OpenAI-Modell Sora lernte aus dem Internet-Vollsortiment
OpenAIs Technologievorstand Mira Murati hat in einem kürzlich geführten Gespräch mit dem Wall Street Journal Einblicke in die neueste Innovation des Unternehmens gewährt: Sora, ein fortschrittlicher Videogenerator, der noch in diesem Jahr auf den Markt kommen soll. Die Plattform, die auf einem breiten Spektrum öffentlich verfügbarer Materialien trainiert wurde – darunter Instagram, Facebook und lizenziertes Material von Shutterstock – steht kurz davor, die Art und Weise, wie wir digitale Inhalte erstellen, grundlegend zu verändern. Doch während die technologischen Fortschritte beeindrucken, wirft Sora auch wichtige Fragen bezüglich Urheberrecht und Datenschutz auf.
Muratis Offenheit in Bezug auf die Fähigkeiten von Sora steht in auffälligem Kontrast zu ihrer Zurückhaltung, wenn es um die spezifischen Trainingsdaten geht. Auf die Frage, ob Inhalte von Instagram oder Facebook Teil des Trainingsdatensatzes waren, antwortet sie lediglich mit einem vieldeutigen "Vielleicht". Diese Geheimhaltung spiegelt die komplexe rechtliche und ethische Landschaft wider, in der generative KI-Technologien operieren.
Trotz der Herausforderungen in Bezug auf die Trainingsdaten sind die von Sora generierten Videos ein eindrucksvoller Beleg für das Potenzial der Technologie, auch wenn sie bei genauerer Betrachtung einige Mängel aufweisen – wie Farbwechsel bei Autos, fehlerhafte Transformationen und unproportionale Gliedmaßen. Diese Unvollkommenheiten unterstreichen die noch zu überwindenden technischen Hürden auf dem Weg zu einer nahtlosen digitalen Realität.
Das Missbrauchspotenzial generativer KI-Technologien ist ein weiterer kritischer Punkt, den Murati anspricht. OpenAI setzt daher auf Red Teaming und die Entwicklung von Methoden zur Kennzeichnung KI-generierter Inhalte, wie die Integration des C2PA-Standards für generierte Bilder. Doch die Effektivität solcher Maßnahmen bleibt angesichts der Leichtigkeit, mit der digitale Metadaten manipuliert werden können, eine offene Frage.
Ein besonders spannender Aspekt von Sora ist die Fähigkeit des Videogenerators, die Konsistenz zwischen den einzelnen Bildern eines Videos zu wahren, eine Eigenschaft, die laut Murati für die Erzeugung flüssiger und überzeugender visueller Erzählungen entscheidend ist. Doch ohne die Unterstützung von Audiospuren bleibt ein wesentlicher Bestandteil der Videoerfahrung unberührt – ein Bereich, in dem Murati zugibt, dass noch erhebliche Verbesserungen erforderlich sind.