Wo München schneller als Hollywood ist
Was Künstliche Intelligenz für Bewegtbild und die Unterhaltungsbranche leisten kann und was (noch) nicht
Die Entwicklung der Künstlichen Intelligenz (KI) im Bereich Bewegtbild und Entertainment geht rasant vonstatten. Doch KI-Tools können menschliche Kreativität nicht ersetzen.
Jacques Alomo, Leiter der KI-Innovation von youknow und Gründer von creamlabs AI, sowie Albert Bozesan, Creative Director AI Media bei Storybook Studios (PAL Next AG), haben im Rahmen der MEDIENTAGE MÜNCHEN gezeigt, was sich bereits heute mithilfe von KI in der Content-Erstellung und -Bearbeitung erreichen lässt – und was nicht.
Jacques Alomo präsentierte Beispiele für die Grenzen und Möglichkeiten aktueller Software-Tools für Bild, Audio und Video. „Was ihr hier heute seht, ist der denkbar schlechteste Zustand“, sagte Alomo, nachdem er einen eigenen, beeindruckend detailfreudigen Clip präsentiert hatte. Er nutzte vor allem Open-Source-Software – und bewies in seinem Impulsvortrag, dass sich mit Programmen wie Flux, Upscaling, Magnifique oder dem Deepfake-Werkzeug Face Fusion bereits heute fotorealistische Bilder erzeugen lassen, die Realaufnahmen in praktisch nichts mehr nachstehen. Vor allem die Feinheiten in Bezug auf Falten und Härchen beispielsweise seien heute von einer ganz anderen Qualität als noch vor einem Jahr.
Die rasante Entwicklung der Videoclips
Noch rasanter verlaufe die Entwicklung, wenn man Videoclips vergleiche, erklärten Alomo: Waren Mimik und Bewegungen von Menschen vor eineinhalb Jahren noch klar als künstlich erzeugt erkennbar, sehen sie heute so gut wie echt aus. Der creamlabs-Gründer bewies das mit alten und neuen Versionen eines bekannten Viral-Clips, der vermeintlich den Hollywood-Star Will Smith beim Spaghetti essen zeigt.
Kurze Clips könne praktisch jede und jeder selbst erstellen. Das wiederum sorge derzeit für massiven Wettbewerb unter den Software-Anbietern. „Fünf bis zehn Sekunden Film kosten etwa 60 Cent“, erklärte Alomo. Und natürlich zahle man die auch, wenn das Ergebnis nicht perfekt sei. Anbieter aus den USA (Runway, Pika und Luma) und China (Kling, Minimax) kämpften erbittert um jede:n Kund:in. Bringe ein Anbieter ein Update, berichtete Alomo, wechselten die Kund:innen eben dorthin.
Was für KI-Bilder gilt, gilt ebenso für Voice-Modelle: Auch hier hatte der creamlabs-Gründer Beispiele dabei, die deutlich machen, wie gut KI-Audio heute Emotionen nachahmen – und mithilfe von Tools wie von Eleven Labs sogar auf die Stimmung der jeweiligen User eingehen kann.
Problematisch ist also weniger die Qualität dessen, was heute schon möglich ist, sondern sind die rechtlichen Fragen: KI-generierte Bilder und Texte lassen sich nicht schützen. Wer aber Neuschöpfungen auf Basis vorhandener Fotos aus Bildarchiven oder von Prominenten erstellt, riskiert eine Klage. Nichtsdestotrotz ermunterte Alomo das Publikum dazu, mit KI zu arbeiten. Wer heute damit beginne, sei immer noch früh dran.
Space Vets – erste originäre KI-Serie
Albert Bozesan von Storybook stellte die weltweit erste originäre KI-Serie vor. Die kommt nicht aus Hollywood, sondern aus München. Die Animationsserie „Space Vets“ handelt von Tierärzt:innen und Wissenschaftler:innen, die mit einem Raumschiff unterwegs sind, um außerirdische Lebewesen zu entdecken – und auch mal ein Kätzchen im All zu retten, wie der Trailer zeigt.
Bozesan betonte, dass Drehbücher und Charaktere von Menschen ausgedacht wurden, denn „nur Kreative wissen, wie Storytelling geht“. Im Anschluss wurde die „KI da eingesetzt, wo sie nützlich ist, also beim Design“. Entwürfe der Figuren und die traditionell modellierten Kulissen wurden in verschiedene Programme eingespeist. Daraus entstanden 3-D-Animations-Charaktere und texturierte Umgebungen. Die Texte der Sprecher:innen wurden mittels KI an die einzelnen Figuren angepasst.
Die Produktion der ersten Folge habe mit sechs Personen sechzig Tage lang gedauert. Üblich waren bisher dreißig Mitarbeitende, die neun bis zwölf Monate tätig waren. „Space Vets“, so kündigte Bozesan hat, werde 2025 in Vollproduktion gehen – zu zwanzig Prozent weniger Kosten und viermal so schnell wie eine klassische Animationsserie.
Auch bei der Entwicklung eines Realfilms bietet die KI Vorteile. Beispielsweise könne man für Science-Fiction- oder Fantasy-Filmideen Bilder generieren, ohne eine Kamera in die Hand zu nehmen. Das sei praktisch, um Projekte zu präsentieren und so die Finanzierung zu sichern, erläuterte Bozesan.
KI ist nur ein Werkzeug
Verdrängt die KI auf lange Sicht den Menschen? „Am Ende ist es nur ein Werkzeug“, sagte Jacques Alomo. „Der Mensch ist unersetzbar – und jemand muss den Output ja auch verifizieren.“ Albert Bozesan ergänzte: Im Bereich Storytelling sei der Mensch besser. „Menschen wissen, wie man andere Menschen erreicht. Hier sollte man nicht sparen“, empfahl er. Über andere Vergütungsformen müsse man, so Bozesan, aber sprechen. Zum Beispiel bei der Maskenbildnerin, die bisher täglich am Set ist und dafür ihre Gage bekommt. Mit KI erarbeite sie einmal ein Charakterdesign, das dann ständig verwendet werde – dem müsse sich die Bezahlung anpassen.
Jungen Leuten rieten die beiden Diskussionsteilnehmer, KI einfach auszuprobieren. „Nutzt die Technologie mit offenen Armen, ihr könnt nur lernen“, sagte Alamo. Wie die KI seien auch Kreative heute ihre schlechteste Version verglichen mit morgen und übermorgen: „Es geht nur bergauf.“