Ping-Pong ums Urheberrecht

Rise Against the Machine. On AI and Why Data is Worth Protecting.

Je leistungsfähiger generative KI-Modelle werden, desto größer wird ihr „Hunger“ nach neuen Daten. Häufig greifen sogenannte Text-zu-Bild-Modelle ohne Zustimmung der Urheber:innen Werke ab, um die generative Künstliche Intelligenz (KI) zu trainieren. Rechtsklagen, in denen Kunstschaffende versuchen, dies zu unterbinden oder zumindest eine angemessene Vergütung ihrer Wertschöpfung zu erreichen, sind nicht zwingend erfolgreich.

Die Anpassung von Urheber- und Leistungsrechten an die technologische Entwicklung hinkt oft hinterher und kostet die Künstler:innen im wahrsten Sinn des Wortes wertvolle Zeit. Wie lässt sich dagegen vorgehen? Das beschrieb Shawn Shan von der Universität Chicago im Rahmen der MEDIENTAGE MÜNCHEN.

Ping-Pong zwischen AI-Konzernen und Urhebern

Shawn Shan sprach von einem „Ping-Pong-Kampf“ zwischen den AI-Konzernen und Urheber:innen. Kunstschaffende, die ihre Werke online ausstellen, stehen oft vor einem Dilemma: Auf der einen Seite stellen Portfolios in sozialen Online-Netzwerken oder auf Websites wichtige Akquise- und Publikationskanäle dar. Auf der anderen Seite können unautorisierte Datenabgriffe oder sogenanntes Data Scraping die Existenzgrundlagen von Künstler:innen gefährden. Denn diese erhalten für die Verwertung ihrer Werke in der Regel keinen Cent – auch dann nicht, wenn Nutzende für die digitalen Kunstwerke, die sie mit KI-Generatoren auf der Basis von Texteingaben („Prompts“) generiert haben, Gebühren zahlen. Sogenannte AI-Mimikry – die Erzeugung beliebig vieler Nachahmungen und Varianten von Originalwerken – hat sich mittlerweile zu einem lukrativen Markt entwickelt.

Das Tool „Gaze” soll Kunstschaffenden helfen, die Kontrolle über die Verwertung ihrer Werke zu behalten. Die Software ist einfach bedienbar und kann auf den lokalen Computer geladen werden. Laut Shawn Shan wurde das Programm bis Oktober 2024 vier Millionen Mal heruntergeladen. Es schreibt die Metadaten der originären Bilddatei so um, dass Text-zu-Bild-Modelle keine neuen Werke im Stil des Originals erzeugen können. Mit dem bloßen Auge sind diese Sicherungen nicht zu erkennen. Shawn Shan sagte, er hoffe, dass der Marktwert der Originale, in denen oft jahrelange Arbeit steckt, auf diese Weise nicht mehr so leicht gedrückt werden kann.

„Vergiftetes“ Prompting

Die Software „Nightshade“ geht einen Schritt weiter: Sie greift direkt die Basis der KI an, indem sie ein generatives Modell massenweise mit Prompts attackiert. Diese Prompt-Sammlungen führen alltägliche Bildmotive ad absurdum. So wird das KI-Modell beispielsweise mit Hundemotiven gefüttert, die aber im Text als Katzenbilder beschrieben werden. Shawn Shan beschrieb diesen Prozess als „vergiftetes“ Prompting. Zu diesem Zweck nutzt die Forschergruppe der Universität Chicago, der Shawn Shan angehört, eine Schwachstelle in den Text-Bild-Generatoren aus. Schon eine im Verhältnis zur Gesamtmenge an Daten relativ geringe Anzahl an Attacken mit vergifteten Prompts korrumpiert die Fähigkeit der Modelle, konsistente Bilder zu erzeugen. Der Vorteil dieser Prompt-Sammlungen sei, so er-klärte Shawn Shan, dass diese als Motive nicht nur beispielsweise Hunde im engeren Sinne umfassen, sondern auch semantisch verwandte Begriffe wie Wolf oder Welpe.

Shawn Shan war sich nicht sicher, ob kritische Forscher:innen und Lobbygruppen der betroffenen Kunstschaffenden mit ihren Schutz-Systemen wirklich die KI-Macht der großen Technologie-Konzerne brechen können. Er hoffe aber, dass der – möglicherweise von mehreren Gruppen orchestrierte – Einsatz insbesondere von „Nightshade“ das Training generativer KI-Modelle verteuern werde. Bestenfalls sei es dann für die Unternehmen günstiger, den Urheber:innen Honorare zu zahlen, als die KI-Modelle wiederherzustellen. Dass IT-Konzerne freiwillig auf Marktmacht und gesellschaftlichen Einfluss verzichten, bezweifelte Shawn Shan. Seine Bedenken seien verstärkt worden, als Sam Altman, der CEO von OpenAI, im Mai 2023 gegenüber der Europäischen Union (EU) drohte, sein Unternehmen werde gegebenenfalls Dienste vom europäischen Markt nehmen, wenn die EU ihr damals kurz vor der Verabschiedung stehendes Regelwerk des Artificial Intelligence Act (AI Act ) nicht entschärfe.

Shawn Shan berichtete, dass er und das Team der Universität Chicago eng mit Kreator:innen und Lobbygruppen verschiedenster Branchen vernetzt seien. Seit sich im Juni 2022 betroffene Künstler:innen an die Forscher:innen der Universität Chicago gewandt und um technische Unterstützung zum Schutz ihrer Werke gebeten hatten, erweiterte sich das Netzwerk unter anderem um Autor:innen, Schauspieler:innen, Gewerkschaften, Unterhaltungsunternehmen und Kunst-Plattformen. Shawn Shan und seine Kolleg:innen tauschen sich auch regelmäßig mit Abgeordneten und Politiker:innen aus.

Am wichtigsten sei, so betonte Shawn Shan abschließend, dass die Themen Urheberrechte und faire Honorare für Kunstschaffende in der Politik stärker wahrgenommen werden müssten. Der europäische AI Act stelle dabei einen wichtigen Schritt dar, Data Scratching einzudämmen.