Zurück

KI-Bilder kennzeichnen: bald Pflicht – aber niemand scheint vorbereitet

Über den EU AI Act, XMP-Metadaten – und die überraschende Erkenntnis, dass die eigentliche Herausforderung nicht die Technik, sondern das fehlende Ökosystem ist.

teblo.de war gerade einmal sechs Wochen online. Jeder Artikel sollte ein eigenes Hero-Bild bekommen: groß, monochrom und stilistisch konsistent – nicht die üblichen Stockfotos, sondern KI-generierte Illustrationen. Sie passen einfach besser zu dem Blog, den ich schreiben möchte.

Nach einigen Experimenten bin ich bei Ideogram gelandet. Die Bildqualität passt, der Graustufenstil ebenfalls. Den Ausschlag gaben am Ende jedoch die Lizenzbedingungen. Ideogram verzichtet ausdrücklich auf Rechte an den generierten Bildern und überträgt sie vollständig an den Nutzer. Das ist bei kommerziellen KI-Diensten keineswegs selbstverständlich.

Der geplante Workflow war erfreulich unspektakulär:
Prompt formulieren. Bild generieren. PNG herunterladen. Ins Artikelverzeichnis legen.

30 Sekunden Arbeit.

Dachte ich.

Zwei Tage später hatte ich mich durch europäisches Regulierungsrecht gelesen, mehrere Metadatenstandards verglichen, diverse Bildgeneratoren untersucht und mich mit ExifTool beschäftigt – einem Werkzeug, das man erst dann richtig schätzen lernt, wenn nichts anderes mehr funktioniert.

Auslöser war eine eigentlich banale Frage: Wie kennzeichnet man KI-generierte Bilder auf einer eigenen Website korrekt?

Nicht als moralische Geste. Nicht als Marketing.

Sondern technisch sauber, möglichst standardkonform und mit Blick auf die Transparenzpflichten des EU AI Act.

Meine erste Vermutung war erstaunlich naiv.

Natürlich würde es dafür längst etablierte Lösungen geben. WordPress hat schließlich für fast alles ein Plugin. Große Static Site Generatoren besitzen leistungsfähige Bildpipelines. KI-Bildgeneratoren schreiben die notwendigen Metadaten vermutlich ohnehin selbst. Ich verwende zwar einen selbst entwickelten Static Site Generator namens hadley, ging aber fest davon aus, hier lediglich ein bereits gelöstes Problem integrieren zu müssen.

Das stellte sich als großer Irrtum heraus.

Ideogram schreibt keine entsprechenden Metadaten. WordPress ergänzt sie nicht. Die großen Static Site Generatoren ebenfalls nicht. Und selbst dort, wo Metadaten vorhanden sind, verschwinden sie oft schon beim ersten Resize oder bei der ersten Formatkonvertierung.

Ich hatte also nicht das Problem, eine bestehende Lösung in meinen Generator einzubauen. Ich hatte das Problem, dass offenbar niemand diese Lösung bisher wirklich gebaut hatte.

Rational betrachtet wäre es vermutlich ausreichend gewesen, die Bilder einfach sichtbar zu kennzeichnen und mich anschließend wieder wichtigeren Dingen zu widmen.

Rational betrachtet entstehen allerdings auch nur wenige selbst geschriebene Static Site Generatoren.


Dieser Artikel ist deshalb weniger eine Anleitung als die Dokumentation einer kleinen technischen Expedition: durch den EU AI Act, durch IPTC-Metadaten, durch C2PA – und durch die etwas irritierende Erkenntnis, dass die Infrastruktur für KI-Transparenz im Sommer 2026 deutlich unfertiger ist, als ich erwartet hatte.

Den Rahmen habe ich dabei bewusst eng gesetzt: ein persönlicher Blog, eine selbst entwickelte Build-Pipeline und Bilder aus einer einzigen Quelle. Enterprise-Compliance, kryptographisch signierte Provenance-Ketten und regulatorische Vollabdeckung sind ein anderes Spielfeld.

  • Der EU AI Act verlangt je nach Anwendungsfall sowohl eine maschinenlesbare als auch eine für Menschen sichtbare Kennzeichnung KI-generierter Inhalte, verbindlich ab 2. August 2026, mit einer Übergangsfrist bis 2. Dezember 2026 für die maschinenlesbare Kennzeichnung bestehender Systeme.
  • Mit iptcExt:DigitalSourceType existiert bereits heute ein praktikabler Standard.
  • Überraschenderweise unterstützen ihn bislang weder viele Bildgeneratoren, noch CMS, noch Static Site Generatoren durchgängig.
  • Die eigentliche Herausforderung ist derzeit nicht der Standard – sondern das fehlende Ökosystem.

Was der EU AI Act tatsächlich fordert

Ich wollte zunächst nur eine einzige Frage klären: Muss ich das überhaupt tun?

Nicht, weil ich die Kennzeichnung vermeiden möchte. Sondern weil ich ungern technische Infrastruktur für Probleme baue, die gar keine sind. Das passiert bei selbst entwickelter Software ohnehin schon häufig genug.

Also habe ich angefangen zu lesen.

Meine Hoffnung war denkbar einfach: Die Rechtslage würde wahrscheinlich kompliziert formuliert sein, sich am Ende aber auf einen überschaubaren technischen Mechanismus reduzieren lassen. Ein Metadatenfeld vielleicht. Ein HTML-Attribut. Irgendetwas, das sich mit vertretbarem Aufwand automatisieren lässt.

Diese Hoffnung hat nicht lange überlebt.

Art. 50 des EU AI Act formuliert nämlich nicht eine, sondern zwei voneinander unabhängige Anforderungen. 1

Zum einen sollen KI-generierte Inhalte maschinenlesbar gekennzeichnet werden.

Zum anderen müssen Menschen erkennen können, dass der Inhalt künstlich erzeugt wurde.

Meine erste Annahme war also bereits falsch.

Ich hatte die Vorgabe als ein Entweder-oder verstanden.

Tatsächlich ist es ein Und.

Ein DigitalSourceType -Eintrag im XMP-Block erfüllt die erste Anforderung. Ein sichtbarer Hinweis im Bild selbst oder in seinem unmittelbaren Umfeld die zweite.


Und dann war da noch eine Zahl, die ich beim ersten Lesen schlicht übersehen hatte.

Art. 50 wird nicht irgendwann anwendbar. Er wird es am 2. August 2026.

Als ich diesen Artikel schreibe, sind das nur noch vier Wochen.

Für die maschinenlesbare Kennzeichnung nach Art. 50(2) gibt es zwar noch eine Übergangsregelung bis zum 2. Dezember 2026. Sie betrifft jedoch bereits am Markt befindliche Systeme und beruht auf der politischen Einigung zum sogenannten Digital Omnibus. 2

Vier Wochen oder vier Monate – beides ist kein Zeitpunkt, an dem man anfängt, sich Gedanken zu machen.


Ob teblo.de überhaupt unter diese Verpflichtung fällt, war zum Zeitpunkt meiner Recherche allerdings überraschend schwer zu beantworten. Die meisten juristischen Kommentare beschäftigen sich mit Marketingmaterialien, Nachrichtenbildern oder realistisch wirkenden Deepfakes. Ein stilisiertes Hero-Bild auf einem Technikblog bewegt sich dagegen in einer deutlich weniger klar definierten Grauzone.

Ich halte es deshalb durchaus für möglich, dass viele meiner Bilder am Ende gar nicht kennzeichnungspflichtig wären.

Trotzdem habe ich mich entschieden, grundsätzlich zu kennzeichnen. Selbst dann, wenn sich später herausstellen sollte, dass einzelne meiner Bilder gar nicht kennzeichnungspflichtig sind.

Nicht aus Angst vor regulatorischen Konsequenzen.

Sondern aus drei deutlich banaleren Gründen.

Erstens: Ich möchte, dass Leser erkennen können, womit ein Bild entstanden ist. Nicht, weil KI-Bilder grundsätzlich problematisch wären. Sondern weil Transparenz für mich zum Handwerk gehört. Wenn ich Werkzeuge einsetze, muss ich sie nicht verstecken.

Zweitens: Die heutigen Bildgeneratoren haben ihren visuellen Wortschatz nicht selbst erfunden. Fotografen, Illustratoren, Designer und Concept Artists haben ihn über Jahrzehnte geschaffen. Das zumindest sichtbar anzuerkennen, erscheint mir weder ideologisch noch besonders belastend.

Drittens: Ich kenne mich gut genug.

Ich hätte bei neuen Artikeln immer und immer wieder darüber nachgedacht, ob dieses Bild nun kennzeichnungspflichtig ist oder nicht. Wahrscheinlich wäre ich jedes Mal zu einem etwas anderen Ergebnis gekommen.

Eine einheitliche Regel kostet am Ende weniger Zeit als zwanzig Einzelfallentscheidungen.

Damit war meine erste Frage beantwortet.

Ich wollte kennzeichnen, jetzt musste ich nur noch herausfinden, wie.


Vielleicht machen das die Bildgeneratoren ja längst selbst.

Meine nächste Vermutung war entsprechend naheliegend: „Vielleicht erledigt sich das Problem ja von selbst“.

Schließlich erzeugen moderne KI-Dienste ihre Bilder nicht erst seit gestern. Der EU AI Act wurde lange diskutiert, IPTC ist kein neuer Standard und C2PA geistert ebenfalls seit Jahren durch Fachartikel und Pressemitteilungen. Warum also sollte ausgerechnet ich Metadaten nachträglich ergänzen müssen?

Also habe ich nachgesehen.

Mein erster Kandidat war Ideogram – schließlich stammen alle Hero-Bilder auf teblo.de von dort.

Das Ergebnis war ernüchternd.

Das heruntergeladene PNG enthält keinerlei Hinweis darauf, dass es von einer KI erzeugt wurde. Kein DigitalSourceType , kein C2PA-Manifest, keine vergleichbare Kennzeichnung. Aus Sicht eines Metadatenwerkzeugs ist das Bild schlicht ein PNG.

Das überraschte mich.

Nicht, weil ich Ideogram dafür kritisieren möchte. Sondern weil ich fest davon ausgegangen war, dass sich ein solcher Standard inzwischen etabliert hätte.

Also habe ich mir auch andere Bildgeneratoren angesehen. 3

Generator C2PA DigitalSourceType Bemerkung
DALL·E 3 / ChatGPT vollständiges C2PA-Manifest
Adobe Firefly Content Credentials
Google Imagen zusätzlich SynthID
Midjourney IPTC, aber kein C2PA
Ideogram keine entsprechenden Metadaten
Stable Diffusion (lokal) abhängig vom verwendeten Workflow
ComfyUI Workflow-JSON, aber kein Standard

Das Bild ist also gemischt.

Einige Anbieter unterstützen moderne Herkunftsnachweise bereits recht konsequent.

Andere schreiben zumindest den IPTC-Eintrag.

Und wieder andere liefern schlicht eine Bilddatei ohne jede Information über ihre Entstehung.

Selbst dort, wo Metadaten vorhanden sind, bleibt allerdings eine weitere Frage unbeantwortet:

Überstehen sie ihren weiteren Weg überhaupt?

Denn zwischen Bildgenerator und Browser liegen häufig noch mehrere Resize-Schritte, Formatkonvertierungen und Optimierungen.

Ein Standard nützt wenig, wenn er unterwegs verloren geht.


Oder es übernimmt jemand anders.

Nachdem die Bildgeneratoren selbst keine einheitliche Lösung bieten, lag der nächste Gedanke eigentlich auf der Hand.

Möglicherweise passiert die Kennzeichnung erst später.

Schließlich landen Bilder nur selten direkt auf einer Website. Dazwischen liegt meist noch das CMS oder ein Static Site Generator. Vielleicht ergänzt dieser die fehlenden Metadaten automatisch. Oder es gibt ein Plugin. Unter Umständen suche ich einfach nur an der falschen Stelle.

Also habe ich weiter recherchiert.

Es gibt einen Satz, den vermutlich jeder WordPress-Nutzer irgendwann einmal gesagt hat:

„Dafür gibt es bestimmt ein Plugin.“

Ich war ziemlich sicher, dass er auch diesmal stimmen würde.

Tat er nicht.

Zum Zeitpunkt meiner Recherche habe ich weder für WordPress noch für die großen Static Site Generatoren eine Lösung gefunden, die DigitalSourceType oder vergleichbare KI-Kennzeichnungen aktiv in Bilddateien schreibt.

Es existieren durchaus Plugins, die XMP-Metadaten auslesen oder anzeigen können. WordPress selbst bringt inzwischen sogar eine einheitliche AI-API mit, damit Plugins verschiedene KI-Dienste ansprechen können.

Ausgerechnet die Kennzeichnung KI-generierter Bilder spielt dort bislang allerdings keine Rolle.

Auch bei den großen Static Site Generatoren sah es kaum besser aus.

Hugo.

Eleventy.

Astro.

SvelteKit.

Alle besitzen leistungsfähige Bildpipelines.

Alle erzeugen WebP- oder AVIF-Derivate.

Keiner kümmert sich dabei um DigitalSourceType.

Natürlich beweist eine erfolglose Recherche nicht, dass eine Lösung nicht existiert.

Sie zeigt aber, wie schwer sie zu finden wäre.

Und genau das ist für die praktische Nutzbarkeit oft schon Aussage genug.

Ich hatte also nicht nur einen Bildgenerator gefunden, der nichts schreibt. Ich hatte ein komplettes Ökosystem gefunden, das sich um dieses Thema bislang erstaunlich wenig kümmerte.

An diesem Punkt blieb eigentlich nur noch ein Werkzeug übrig:

ExifTool

ExifTool – mächtig, aber eigenwillig

ExifTool gehört zu diesen Programmen, die man erst dann richtig schätzen lernt, wenn nichts anderes mehr funktioniert.

Seit mehr als zwanzig Jahren entwickelt Phil Harvey ExifTool praktisch im Alleingang weiter.

Monat für Monat erscheinen neue Versionen – oft mit Unterstützung für neue Kameramodelle, Dateiformate oder Metadatenstandards.

Vieles davon bleibt außerhalb der Fotowelt weitgehend unbemerkt.

Eigentlich zu Unrecht.


Dabei dürfte ExifTool heute eines der wichtigsten Werkzeuge überhaupt sein, wenn es um Metadaten geht.

Die Kehrseite dieser Reife zeigt sich allerdings schon nach wenigen Minuten.

ExifTool wirkt an manchen Stellen wie ein Werkzeug aus einer anderen Zeit.

Nicht alt.

Sondern gewachsen.

Mächtig.

Unglaublich flexibel.

Und nicht unbedingt darauf ausgelegt, Einsteiger freundlich an die Hand zu nehmen.

Wer lediglich einen Copyright-Eintrag ändern möchte, merkt davon vermutlich wenig.

Sobald jedoch eigene XMP-Namespaces, Konfigurationsdateien und komplexere Metadaten ins Spiel kommen, steigt die Lernkurve spürbar an.


Genau das machte ExifTool für mein Vorhaben gleichzeitig zur besten und zur anstrengendsten Wahl.

Ohne ExifTool wäre dieser Artikel vermutlich deutlich kürzer geworden.

Oder deutlich länger.

Denn an diesem Punkt wurde mir klar, dass ich immer wieder dieselben Befehle zusammensuchte, dieselben Konfigurationsdateien anpasste und dieselben Metadaten kontrollierte.

Spätestens da stand ich vor zwei Möglichkeiten:

Ich konnte das bei jedem Bild erneut tun.

Oder ich konnte mir ein Werkzeug schreiben, das genau diese Arbeit übernimmt.

Ich habe mich für Letzteres entschieden.


An dieser Stelle könnte man völlig zurecht einwenden, dass sich dieses Problem auch mit einem Shell-Skript lösen lässt.

Wer nur gelegentlich einzelne Bilder verarbeitet, braucht dafür weder eine TUI noch ein eigenes Werkzeug.

Genau das hatte ich ursprünglich ebenfalls vor.

Überraschend war für mich weniger die technische Schwierigkeit als die Erkenntnis, dass es für einen inzwischen durchaus relevanten Anwendungsfall offenbar noch keinen etablierten Workflow gibt.


Was als kleine Recherche begann, entwickelte sich damit unerwartet zu einem eigenen Projekt.

Eigentlich wollte ich nur einige Hero-Bilder für meinen Blog korrekt kennzeichnen.

Stattdessen habe ich gelernt, dass zwischen gesetzlichen Anforderungen, vorhandenen Standards und der Realität heutiger Werkzeuge eine erstaunlich große Lücke klafft.

Vermutlich schließt sie sich in den nächsten Jahren von selbst.

Für meinen Blog wollte ich allerdings nicht so lange warten – also habe ich begonnen, eine Lösung zu bauen.

Wie daraus schließlich aiprov entstand, warum ExifTool plötzlich eine TUI bekam und weshalb Sharp dabei noch einmal für ganz eigene Überraschungen sorgte, ist eine Geschichte für den nächsten Artikel.


Kommentar schreiben