Text und Data Mining durch Nutzungsvorbehalt untersagen

Die Nutzung von Bildern zum Training einer KI nennt man „Text und Data Mining“. Wer dies untersagen möchte, sollte einen Nutzungsvorbehalt erklären.

Immer mehr KI-gesteuerte Generatoren finden ihren Weg ins Internet und werden von zahlreichen Nutzern verwendet. Für Bildanbieter sind dabei sogenannte „text-to-image KI-Generatoren“ von besonderem Interesse. Diese funktionieren so, dass der Nutzer einen beliebigen Text in ein Textfeld eingibt und die KI dann ein dazu passendes Bild erstellt.

Die KI muss, um möglichst realistische bzw. „gute“ Ergebnisse zu produzieren, dafür trainiert werden. Hierfür werden der KI möglichst große Datensätze von Bildern mit Beschreibungen dergleichen zum Analysieren gegeben. Je größer der Datensatz, desto besser das spätere Ergebnis.

Die Zusammenstellung von „Trainingsdaten“ und auch der „Trainingsprozess“ werden dabei grundsätzlich als „Text und Data Mining“ verstanden.

Kein Text und Data Mining ohne Vervielfältigungshandlung

Rechtlich ist der Vorgang unter Berücksichtigung der EU-Richtlinie 2019/790 (Directive on Copyright in the Digital Single Market, DSM-RL) und der Umsetzung im Urhebergesetz zu bewerten. Grundvoraussetzung für die urheberrechtliche Relevanz des „Text und Data Mining“ ist dabei immer, dass auch eine Vervielfältigung enthalten ist.

In der DSM-RL sind insbesondere die Art. 3 und 4 relevant, die ihre Umsetzung auf deutscher Ebene in den §§ 44b und 60d UrhG erfuhren. Die genannten Artikel der RL geben den Mitgliedsstaaten einen groben Rahmen vor, eigene Regelungen zu schaffen. Insbesondere die Nutzung von „Text und Data Mining“ zu wissenschaftlichen Zwecken steht demnach im Vordergrund (Art. 3 DSM-RL), aber auch das generelle „Text und Data Mining“ durch jedermann, soll durch die Mitgliedstaaten geregelt werden (Art. 4 DSM-RL).

Spezielle Regelung für wissenschaftliche Zwecke – § 60d UrhG

Eine Nutzung von entsprechenden Datensätzen in Form eines „Text und Data Mining“ ist zunächst zu wissenschaftlichen Zwecken denkbar, § 60d UrhG. Demnach ist es – zusammenfassend – für alle nicht-kommerziellen (wohl insbesondere öffentlichen) Forschungsorganisationen und -einrichtungen erlaubt, „Text und Data Mining“ zu bestimmten Zwecken zu betreiben. Das kann nicht verhindert werden.

„Text und Data Mining“ durch die Privatwirtschaft – § 44b UrhG

Bei der Nutzung von Datensätzen zu kommerziellen Zwecken kommt es nach nationalem Recht maßgeblich auf § 44b UrhG an. Danach ist es ebenso grundsätzlich zulässig, Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining zu verwenden. Das lässt aufhorchen, dürfte damit im Grunde ein Bezug zu den Google-Bildersuche-Urteilen gezogen werden können. Selbst eine schlichte Einwilligung führt demnach zu einer rechtmäßigen Nutzung. Anders gesagt: Wer sein Bild ins Internet stellt oder stellen lässt, muss mit Text und Data Mining rechnen.

Das führt uns jedoch zu § 44b Absatz 3 UrhG. Der Urheber kann die Nutzung „verbieten“ (lassen):

„Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.“

Ein solcher Nutzungsvorbehalt wird umgangssprachlich auch „opt-out“ genannt. Solange ein solcher „opt-out“ nicht geschehen ist, ist es den Unternehmen, die einen KI-Generator betreiben, rechtlich erlaubt, die entsprechenden Bilder in den Datensätzen zum Training zu verwenden.

Vorschlag für formulierten Nutzungsvorbehalt nach § 44b Absatz 3 UrhG

Für analog verfügbare Werke kann der Urheber einen Vorbehalt mit vertraglichen Vereinbarungen und einseitigen Erklärungen aussprechen (ErwG. 18 der DSM-RL).

In Bezug auf Online-Werke muss ein entsprechender Nutzungsvorbehalt in „maschinenlesbarer Form“ erfolgen. Sinnvoll und effizient erscheint es daher den Nutzungsvorbehalt durch eine entsprechende Klausel zu implementieren, z.B. in der Robots.txt – also auslesbar für Webcrawler. Zusätzlich ist zu empfehlen, den Vorbehalt auch in den IPTC-Daten eines Bildes zu hinterlegen soweit möglich. Denn diese sind gleichermaßen ein binärer Datenblock der grds. maschinenlesbar in der Bilddatei eingebettet ist.

Rechtlich spannend dürfte eine Einbindung (zusätzlich) in AGB einer Website sein. Denn der § 44b UrhG ist dispositiv, d.h. es kann etwas anderes durch Vertrag vereinbart werden. Sofern also nur in den AGB ein Vermerk erfolgen soll, sollte dieser rechtlich abgestimmt werden.

Nutzungsvorbehalt wirkt nur für die Zukunft

Sollten Bilder schon in der Vergangenheit verwendet worden sein und es bestand kein entsprechender Nutzungsvorbehalt, ist eine Nutzungseinschränkung nur für die Zukunft möglich. Für die kommerzielle Nutzung in der Vergangenheit sieht § 44b UrhG auch keine Vergütungspflicht zugunsten der Urheber vor.

Wer also Text und Data Mining verhindern will, sollte einen Nutzungsvorbehalt erklären, um sicherzustellen, dass die Bilder von neuen KI-Generatoren oder bei Wiederaufrufen von alten KI-Generatoren nicht ohne entsprechende Vergütung verwendet werden.

Sollte ein Verstoß gegen einen Nutzungsvorbehalt vorliegen, kann eine Unterlassung und gegebenenfalls auch ein Schadensersatz im Wege der Lizenzanalogie erwirkt werden. In diesem Fall wäre es sinnvoll, anwaltlichen Rat in Anspruch zu nehmen, um eine fundierte Entscheidung treffen zu können.

Die Frage in der Praxis allerdings bleibt: Das Problem der Nachweisbarkeit. Hier wird sich zeigen müssen, welchen Maßstab die Gerichte ansetzen und ob es eine Beweiserleichterung für die Urheber geben wird.

 

Über den Autor

Rechtsanwalt Florian Wagenknecht ist Fachanwalt für Urheber- und Medienrecht und Partner der Bonner Kanzlei TWW.law. Als Mitgründer des Magazins „rechtambild.de“ und aufgrund zahlreicher Fälle zum Urheber- und Persönlichkeitsrecht besitzt er eine spezielle Expertise im Bereich des Foto- und Lizenzrechts. Seit Jahren berät und vertritt Florian Wagenknecht vorwiegend Fotografen, Bildagenturen und (Zeitungs-)Verlage bei der Durchsetzung ihrer Rechte. Er ist zusätzlich zertifizierter Datenschutzbeauftragter (TÜV), Lehrbeauftragter und Autor.

Comments are closed.