Ende 2022/Anfang 2023 wird in Erinnerung bleiben als die Zeit, in der Inhalte generierende Künstliche Intelligenz(KI)-Systeme in den Alltag einbrachen. Bei Texten ist ChatGPT zum allseits bekannten System geworden, bei Fotos sind Dall-E, Midjourney oder Stable Diffusion populär. Viele freuen sich über die fotorealistischen Bilder, aber es fragen sich auch viele, wie man mitteilen kann, dass diese visuellen Produkte nicht eine konkrete Realität abbilden, sondern von einem KI-Generator als eine Mischung aus tausenden Realitäten erzeugt wurden. Ein effizienter Ansatz zu einer Lösung kommt mit den IPTC Fotometadaten.
Die grundlegendste Aussage über ein KI-erzeugtes Bild ist, dass es von KI erzeugt wurde. Dies kann mit dem IPTC Feld Digital Source Type (deutsch „Typ der Digitalquelle“ oder „Quelltyp“) und speziellen Werten aus einem IPTC Vokabular festgehalten werden. Dieses ist das gleichnamige Digital Source Type Vokabular mit traditionellen Begriffen und solchen, die auf synthetische Bilder bezogen sind. Die traditionellen Werte decken eine „Originale Digitalaufnahme einer realen Szenerie“ oder die Digitalisierung von analogen Aufnahmen auf Film oder als Ausdruck ab.
Die neuen Werte mit KI-Bezug sind:
- Bild mit einer Mischung aus realen und künstlichen Elementen: das gezeigte Bild wurde etwa mit Photoshop aus mehreren Bildern zusammengebaut, zumindest eines der Bilder wurde synthetisch über Software erzeugt. Diese formale Kennung ist als Wert des Feldes zu verwenden: http://cv.iptc.org/newscodes/digitalsourcetype/compositeSynthetic
- Mit Algorithmen erzeugtes Bild: die Pixel des Bildes wurden von einem Computerprogramm nach einem Regelwerk erzeugt, z.B. eine Mandelbrot-Menge oder ein fraktaler Algorithmus. Diese formale Kennung ist als Wert des Feldes zu verwenden: http://cv.iptc.org/newscodes/digitalsourcetype/algorithmicMedia
- Mit trainierten Algorithmen erzeugtes Bild: die Pixel des Bildes wurden von einem Computerprogramm auf der Basis eine KI-Modells erstellt, wobei das Wissen des KI-Modells durch Analyse von tausenden existierenden Bildern erzeugt wurde. Diese formale Kennung ist als Wert des Feldes zu verwenden: http://cv.iptc.org/newscodes/digitalsourcetype/trainedAlgorithmicMedia
Google hat bei seiner Jahrestagung Google I/O am 10. Mai 2023 angekündigt, dass bei der Analyse von Bildern dieses IPTC Feld Digital Source Type erfasst wird. Wenn einer der drei oben angeführten Werte gefunden wird, wird in den Ergebnissen einer Bildersuche zu solchen Bildern die Anmerkung „AI-Generated“ gezeigt. Damit ist sofort erkennbar, dass diese Bilder nicht durch menschliche Kreativität entstanden sind.
Unmittelbar danach haben die Unternehmen Midjourney und Shutterstock AI angekündigt, entsprechende Werte dieses IPTC Feldes in von ihnen generierte KI-Bilder einzutragen.
Bildanbieter wie die BVPA-Mitglieder können nun konkrete Maßnahmen setzen: entweder dafür sorgen, dass ein von einem KI-Generator gesetzter Wert des Digital Source Type erhalten bleibt, oder ihn selbst setzen.
Leider gibt es zu diesem Thema noch eine Hürde: das Feld Digital Source Type wird schon von einigen professionellen Programmen zum Bearbeiten von IPTC Fotometadaten angezeigt, aber es fehlt aktuell noch die Möglichkeit, einen der oben genannten Werte auch eintragen zu können. Denn solche Werte aus Vokabularen können meist nur durch Auswahl aus einer aufklappenden Liste ausgewählt und gesetzt werden. Wenn Sie Interesse an diesen neuen KI-bezogenen Werten haben und diese nicht in Ihrem Programm vorfinden, wenden Sie sich an den Hersteller Ihres Programms und drängen Sie ihn, das neue Vokabular umzusetzen und falls es fehlt auch das Feld bereitzustellen – nach IPTC-Erfahrung hilft ein Drängen durch Kunden am meisten.
IPTC ist bekannt, dass es noch weitere wesentliche Themen in diesem Bereich gibt: wie kann man (mit Metadaten) verhindern, dass ein Bild für das Training von KI-Generatoren verwendet wird; wie kann man bei einem von einem KI-Generator erzeugten Bild Informationen dazu – etwa welcher Generator verwendet wurde und welches Prompt das Bild ausgelöst hat – festhalten. Diese Fragen zu beantworten ist aufgrund der Dynamik dieses Bereichs nicht einfach, aber IPTC arbeitet daran.
Wenn Sie Fragen zu IPTC Fotometadaten haben, können Sie gerne der IPTC Email-Liste beitreten: https://groups.io/g/iptc-photometadata
Michael Steidl, Co-Leiter der IPTC Fotometadaten Arbeitsgruppe / Stand 15.05.2023
About International Press Telecommunications Council (IPTC)
IPTC is the Global Standards Body of the News Media. Our mission is to simplify the distribution of information. We develop and promote efficient technical standards to improve the management and exchange of information between content providers, intermediaries and consumers. We thereby enable easy, cost-effective and rapid innovation and product development. We are committed to open standards and make all of our standards freely available to our members and the wider community. Founded in 1965 and based in London, the IPTC brings together the world's leading news agencies, publishers and industry vendors.