12
Jan. 2026

KI: Gefangen zwischen Foto-Wunsch und Foto-Wirklichkeit – was kostet der Spaß?

Themen: Film, TV & Presse, Künstliche Intelligenz |

Ich hatte erst vor zwei Wochen darüber geschrieben, dass mir eine Kombination von Topaz Photo Pro auf dem Desktop und ChatGPT im Netz hilft, alte Bilder zu restaurieren – auch wenn ich immer wieder an Grenzen stoße, seien es die teilweise abstrusen "guardrails" bei ChatGPT oder die potenten, aber doch limitierten Funktionen von Topaz.

Ehrlich jetzt – DAS kann wegen möglicher Verstöße gegen die Regeln in Sache Erotik und lasziver Darstellung nicht durchgewunken werden?!

Man gewöhnt sich dran und entwickelt Workarounds.

Heute möchte ich euch primär ein paar beeindruckende Praxisbeispiele präsentieren, die Limits von KI-Retusche aufzeigen und erklären, warum kostenpflichtige Angebote bei ChatGPT durchaus lohnen – aber ein Blindflug sind.

Zwei Details vorab: Ich habe andere KIs ausprobiert (Grok, Gemini, Perplexity), aber keine kann auch nur annähernd so überzeugend retuschieren wie ChatGPT. No contest. Und ich spreche mit der KI englisch, auch wenn sie deutsch mit mir spricht. Ich fühle mich bei der Formulierung von Prompts damit einfach sicherer.

Zuerst einmal die Aufgabenstellung: Ich habe mich entschlossen, zum Jahresbeginn meinen gesamten Bilderbestand auf meinen Festplatten neu zu sortieren. Wir reden von ungefähr 20.000 privaten Bildern (Familie, Hochzeit, Reisen, Katzen), und weiteren 30.000 Medien-Images (Scans, Web-Fotos, Screenshots, Dia-Scans von Serien, Flyer, Promo-Material). Alles bisher bestenfalls grob geordnet und selten ordentlich beschriftet.

Nach einiger Planung habe ich mich entschieden, alle einzelnen Kategorien sorgsam nach Alben geordnet bei Google Fotos unterzubringen, mit einem kompletten Backup auf einer externen Festplatte. Den größten Vorteil von Google Fotos erwähnte ich bereits: die leistungsstarke Suchfunktion finde alles auch ohne Beschriftung.

Nun kann sich jeder Leser denken, dass es unsexy ist, auf einem Web-Portal oder am Smartphone oder dem heimischen Fernseher zigtausende Bilder an sich vorbei ziehen zu lassen. Ich habe mich deshalb entschieden, den Großteil der Bilder, die sowieso nur selten bis nie gebraucht werden, in Archiv-Alben im Hintergrund zu sichern.

Für den sofort sichtbaren und zugänglichen Bereich baue ich eine komplett neue Sammlung an Alben auf, die zu jedem Thema nur das "best of" enthalten. Das krasseste Beispiel: wir haben mehr als 1000 Fotos unserer Katzen. Das kann man keinem Gast zumuten, da finde ich auch die schönsten Schnappschüsse nie, wenn ich sie brauche. Also habe ich die 50 besten Aufnahmen von Rufus und Becky für den "best of"-Ordner ausgesucht.

Den Rest findet im Bedarfsfall die Suchfunktion von Google Fotos trotzdem.

Und es sind auch nur diese "best of"-Aufnahmen, die ich mit KI überarbeite, um sie so präsentabel wie möglich zu machen. Das hat zwei Gründe: zuerst einmal habe ich keine Monate Lebenszeit, um fast 50.000 Bilder in die Digital-Retusche zu geben. Hinzu kommt, dass die KI-Verbesserungen momentan noch klaren Limitierungen unterliegen: so wirft ChatGPT die Bearbeitungen in einer maximalen Größe von 1536 x 1024 aus. Die kann ich zwar ordentlich vergrößern, aber wirklich prall ist das nicht.

Also bearbeite ich nur die Besten der Besten – in ein paar Jahren wird es schnellere und noch perfektere Methoden geben, den Rest durch die digitale Waschanlage zu schicken. Dann will ich mich nicht über die heute verschwendete Zeit ärgern.

Nun aber in medias res – das hier ist ein typisches Dia der Serie WINSPECTOR, wie es in den frühen 90ern von RTL an die TV-Zeitschriften verschickt wurde:

Das ist nicht wirklich mehr verwendbar. Ich habe den Scan zuerst in Topaz Photo Pro geladen, war mit dem Ergebnis aber nicht wirklich zufrieden:

Heller, ein bisschen schärfer – aber je näher man herangeht, desto mehr zerbröselt das Bild wieder. Also muss ChatGPT die Scharte auswetzen – das Ergebnis ist nicht weniger als fantastisch:

Ich bezweifle, dass die Serie WINSPECTOR im Original jemals so gut aussah.

ChatGPT ist auch überlegen, wenn es darum geht, mit KI die Originalfarben eines verblassten oder rotstichigen Bildes in alter Schönheit zu regenerieren. Mein Kumpel Dave aus Michigan schickte mir vor vielen Jahren mal diesen "behind the scenes"-Dia-Scan der ersten Star Trek-Serie:

SO hat das bestenfalls noch Kuriositätenwert – in Photoshop konnte ich einiges händisch nachregeln, aber man kann Scheiße bekanntermaßen nicht polieren:

Also bat ich ChatGPT, das Bild bestmöglich zu restaurieren und sich dabei im Zweifelsfall an den Farben der klassischen Serie zu orientieren:

Ich gestehe: die KI schafft es immer wieder, mich umzuhauen. ABER: wer genau hinguckt, wird einen "Fehler" entdecken, eine Halluzination. Im Original schaut der Mann mit der Klappe in die Kamera, bei ChatGPT nicht.

Das mag für die meisten User ein lässliches Problem sein, zumal man die KI anweisen kann, bei einem zweiten Durchlauf den Fehler nicht zu wiederholen. Aber wenn man die Authentizität einer Aufnahme bewahren will, sollte das natürlich grundsätzlich nicht passieren. In diesem Kontext habe ich gelernt, welche Sprache ChatGPT braucht, um den Wunsch nach Restauration richtig zu verstehen.

Das hier ist mein Allerweltsprompt zur Aufarbeitung alter Aufnahmen:

Please upscale, sharpen, focus, retouch, recolor, adjust lighting, and eliminate all specks and scratches.

Erst im Gespräch mit ChatGPT dämmerte mir, dass die KI diese Aufforderung als Erlaubnis sieht, die Aufnahme leicht zu verändern, um sie zu verbessern. ChatGPT selbst schlug als Alternative einen restriktiveren Prompt vor:

Please perform technical photo restoration only: correct color fading, normalize exposure, reduce noise and film grain, remove dust, scratches, and scan artifacts, and improve overall clarity. Preserve the original composition, lighting intent, and all facial and anatomical details exactly as-is. Do not add, remove, stylize, or reinterpret any visual elements.

Damit bleibt das Bild vollumfänglich erhalten, die Restauration ist allerdings nicht so perfekt. Ich habe als goldenen Mittelweg für mich mittlerweile diese Variante entwickelt:

Please upscale, sharpen, focus, retouch, recolor, adjust lighting, and eliminate all specks and scratches. Don’t change anything about the facial features.

Das liefert in 90 Prozent der Fälle die erwünschten Ergebnisse. Bei Schwarzweiß-Fotos nehme ich das "recolor" raus, wenn sie schwarzweiß bleiben sollen. Bei rein digitalen Fotos ist "eliminate all specks and scratches" überflüssig.

Ein Fallbeispiel – hier ein Dia der Serie DIE MASKE aus den frühen 90ern:

Der ChatGPT-Prompt bleibt extrem nahe an der Vorlage, auch wenn er vor allem die Lichtsituation an den Jalousien unangebracht anpasst:

Ein oberflächlich deutlich besseres Ergebnis liefert mein ursprünglicher Prompt:

ABER: Je genauer man hinschaut, desto klarer wird, dass ChatGPT sich wieder zu viel erlaubt hat. Rick Springfield hat eine andere Gesichtsform, eine andere Frisur, sogar eine deutlich hellere Haarfarbe. Das ist perfekter, aber nicht mehr "echt".

Genau deshalb bleibe ich bei meinem angepassten Prompt, der Veränderungen an Gesicht und Haltung ausschließt.

Darüber hinaus bleibt ChatGPT weiter ein faszinierendes Werkzeug. So hatte ich vor Jahren ein Bild aus meiner Kindergartenzeit in Monheim ausgebuddelt:

2012 konnte man so etwas nur mit Photoshop und viel Frickelei ausbessern – über das Ergebnis habe ich vor 14 Jahren sogar stolz geschrieben:

Das mag 2012 auch wirklich beeindruckend gewesen sein – im Zeitalter von KI ist es aber Moppelkotze. Ich habe das Original nochmal durch ChatGPT laufen lassen:

SO sahen die 70er aus – wir lebten in Beton und buntem Polyester!

Erlaubt mir noch ein letztes Beispiel, bevor wir uns an den Kassensturz machen. Mein Bruder hat wenig Fotos aus seiner wilden Jugend (er gehörte zu den Punks in und um den Ratinger Hof). Das hier wurde irgendwie in einer Kiste aufbewahrt:

Mein Bruder ist der schlanke junge Mann rechts. Der Typ in der Mitte sieht verdächtig aus wie Peter Illmann, aber das kann ich nicht verifizieren. Die Details sind insgesamt so schlecht, dass man kaum hoffen darf, hier eine perfekte Rekonstruktion hin zu bekommen. Je weniger die KI erkennen kann, desto mehr muss sie erfinden.

Ich habe erstmal Topaz damit beauftragt, das Bild zu schärfen, die Gesichter zu rekonstruieren, und das Motiv zu vergrößern. Dann habe ich ChatGPT gebeten, alle Kratzer und Flecken zu entfernen und eine allgemeine Restauration anzuschieben. Ich hatte mir nicht viel erhofft, aber das hier überzeugt:

Aus einer Laune heraus habe ich ChatGPT noch gebeten, das Bild zu kolorieren. Man achte darauf, dass dieser Vorgang dem Herrn links die Augen geöffnet hat:

Die KI ist übrigens nicht rein mechanistisch, wenn sie Bilder rekonstruiert. Sie recherchiert tatsächlich den Kontext der Aufnahmen, wie man perfekt an den temporären Namen sehen kann, die sie verteilt. So habe ich ihr ein Bild zum Fraß vorgeworfen, auf dem ich eine uralte Spielekonsole noch mal anwerfe. Tatsächlich "weiß" die KI, was sie sieht:

Im Fall einer Promo-Aufnahme der Serie ALIEN NATION kann ChatGPT sogar problemlos die Rasse der Aliens identifizieren:

Als ich vor ein paar Jahren eine seltene Anzeige für den nie produzierten Spider-Man-Film von Cannon entdeckte, passte sie wegen Übergröße nicht auf meinen A4-Scanner. Ich scannte die Seite deshalb dreimal und jedes Mal war ein Rand komplett zu sehen. Tatsächlich versagte ChatGPT bei der Bitte, die drei Seiten übereinander zu legen und daraus das Motiv komplett zu rekonstruieren – Gemini hatte diese Probleme nicht:

Bleiben wir noch einen Moment bei Gemini und der Fähigkeit, Bilder nicht nur zu retuschieren, sondern für die Weiterverwendung über den Einsatzzweck hinaus aufzubereiten. Vor über 20 Jahren startete McDonald’s einen kurzlebigen Versuch, mit DONATO’S eine eigene Pizzakette aufzubauen. Am Tag, nach dem die Filiale in Obergiesing geschlossen wurde, habe ich mit meiner klobigen Samsung Digimax A6 durch die Scheibe die Speisekarte fotografiert:

Als mir diese Aufnahme wieder in die Hände fiel, bat ich Gemini, die Speisekarte bestmöglich zu extrahieren. Bis auf ein paar kleinere Schreibfehler, die den starken Reflektionen in der Scheibe zu verdanken sind, klappte das super:

Man sieht: KI kann viel, aber nicht alles, und bei jeder Retusche sollte man mit kritischem Blick drauf schauen, ob das wirklich noch authentisch genug wirkt.

Ich für meinen Teil kann sagen, dass mir die Restaurierung auch emotional sehr viel gebracht hat, weil sie mit den Bildern auch vielen Erinnerungen frische Farben verleiht und die abgebildeten Personen noch mal lebendig werden.

Ich gehe sogar einen Schritt weiter: während wir bisher analoge Fotos nur scannen und damit tot "in Kopie" in die digitale Sphäre heben konnten, erlaubt die KI eine dem digitalen Zeitalter angemessene Neuverortung alter Aufnahmen. Die Umwandlung in Bits und Bytes ist nicht mehr ein zwangsweiser Qualitätsverlust, sondern Fundament neuer Möglichkeiten, unser Leben in Bildern festzuhalten.

Und damit kommen wir zum Geld.

Ich finde es bizarr und eigentlich skandalös, dass wir es hinnehmen sollen/ müssen, dass wir mit der KI die Katze im Sack kaufen. Tatsache ist, dass z.B. ChatGPT einen konkreten Preis für seine verschiedenen Abo-Modelle verlangt, bei der Auflistung der dafür zu erwartenden Leistung aber frustrierend vage bleibt.

Auf Nachfrage erklärt ChatGPT sein "pricing" folgendermaßen:

Die offiziellen Angaben von OpenAI zu den konkreten Bild-Limits für das ChatGPT Go-Abo sind derzeit nicht öffentlich detailliert dokumentiert in der Help-Center-Dokumentation. Es ist aber bekannt, dass ChatGPT Go erweiterten Zugriff auf Bildgenerierung gegenüber der kostenlosen Version bietet und mehr Bilder pro Tag erlaubt als im Free-Plan.

Das ist, also ob man an der Tanke erklärt bekommt, dass man für 100 Euro mehr Benzin bekommt als für 50 Euro – aber wie viel Benzin das genau ist, möchte die Tanke lieber nicht sagen.

ChatGPT zu dem, was man "free" und im "Go-Abo" erwarten kann:

Geschätzte Bild-Limits (nicht offizielle OpenAI-Angaben)
Free-Plan: sehr wenige Bilder (typisch ca. 2–3 pro Tag) ohne Abo.
ChatGPT Go: soll laut mehreren Berichten ungefähr 10× mehr Bildgenerierungskapazität als Free bieten, also etwa ~20 Bilder pro Tag (als grober Erfahrungswert/Schätzung aus Community-Analysen).

Auch das verdient ein gepflegtes "are you fucking kidding me?". Insbesondere für den Sprung vom Free-Account in ein bezahltes Abo-Modell möchte ich schon wissen, was meine konkreten Vorteile sind. Ein befreundeter Anwalt meinte gestern, dass dieses Gebaren locker mit einer Klage auszuhebeln sein sollte.

Zumindest kann ich anhand meiner Erfahrungen der letzten zwei Wochen berichten, dass die hier gemachten Angaben schlimmstenfalls Kappes, bestenfalls nur überholt sind. Vielleicht ist das aber auch nur in Deutschland so.

Fakt ist: Mit meinem Free-Account konnte ich 5 Bilder am Tag in ChatGPT generieren oder restaurieren. Auch missglückte oder von der KI abgelehnte Motive zählten. War der interne Zähler am Ende, musste man satte 24 Stunden warten, um wieder freigeschaltet zu werden.

Das war mir erwartungsgemäß zu wenig, als ich mich ernsthaft an die Restaurierung meines Bildarchivs begab. Allerdings fand ich die Aussicht, statt 5 nun 20 Bilder gegen Geld generieren zu können, ziemlich mau. Aber Versuch macht kluch und man kann jeden Monat kündigen.

Es stellt sich heraus, dass der Go-Account längst nicht so restriktiv ist, wie ChatGPT insinuiert hatte – nur sehr eigensinnig.

Ein Bild zu generieren oder zu restaurieren, dauert 30 bis 50 Sekunden. Man kann auch mehrere gleichzeitig durchlaufen lassen. Es war für mich kein Problem, 30 oder 40 Bilder in Folge zu generieren. Statt eines strikten, aber undokumentierten Limits taucht immer mal wieder eine solche Mitteilung auf:

Es ist nicht nachvollziehbar, wann und warum die Meldung kommt, und die Zwangspause wird jedes Mal unterschiedlich gesetzt – ich hatte auch schon vierzehn Minuten und eine (!) Minute, bevor ich weitermachen konnte. Aber dann läuft es wieder ohne Restriktionen. Ich sehe diese Warnung mittlerweile als Aufforderung zur Kaffeepause.

Generell scheint es kein Tageslimit zu geben – gestern habe ich mindestens 150 Fotos restauriert. Das macht den Go-Account perfekt für meine Zwecke.

Lohn sich das für Otto Normaluser? Schwer zu sagen. Bei mir gleicht es sich aus, weil ich MidJourney storniert habe. Die Tatsache, dass man keine langfristigen Verträge mehr eingehen muss, ist eindeutig ein Vorteil. Wer nur ab und an mal ein Bild generiert, mag mit dem Free-Account auskommen. Wer sich ein paar Tage Zeit nimmt, um alte Familienalben zu restaurieren, kann den Go-Account auch nur für einen Monat aktivieren. Jeder nach seinem Nutzerprofil.

Das ist der Stand. Ich hoffe, meine Ausführungen waren hilfreich, damit ihr ein besseres Verständnis bekommt, was ChatGPT kann – und wo es (noch?) hakt…



Abonnieren
Benachrichtige mich bei
guest

14 Kommentare
Älteste
Neueste
Inline Feedbacks
Alle Kommentare anzeigen
S-Man
S-Man
12. Januar, 2026 12:27

Danke, ich finde es immer spannend, aus deiner Sicht die KIs beschrieben zu sehen, gerade auch, weil meine restliche Bubble (und ich selbst auch) eher dem Ganzen kritisch gegenüberstehen. Deine Storys sind ein guter Gegenpol!

Last edited 29 Tage zuvor by S-Man
Stefan
Stefan
12. Januar, 2026 13:32

"Als mir diese Aufnahme wieder in die Hände fiel, bat ich Gemini, die Speisekarte bestmöglich zu extrahieren. Bis auf ein paar kleinere Schreibfehler, die den starken Reflektionen in der Scheibe zu verdanken sind, klappte das super"

Schau da nochmal drauf. Gemini hat die halbe Karte umgeschrieben. Aus "Auf diesem knusprig extradünnen Teig" (oben links) ist zB "Auf knusprig-dünnem italienischen Teig" geworden. Bei den einzelnen Pizzen stehen teils völlig andere Beläge und es hat die "Vegy" von der Karte gestrichen und durch eine zweite "The Works" samt deren Belag ersetzt. Im unteren Teil der Karte ist sogar das gesamte Layout geändert worden. Da ist gar nichts mehr echt dran.

Last edited 29 Tage zuvor by Stefan
Stefan
Stefan
12. Januar, 2026 13:44
Reply to  Torsten Dewi

Ich find das mit dem kritischen Blick ist auch ein absolut wichtiger Punkt und finde es gut, dass du das herausstellst. Was das Aufbereiten historischer Aufnahmen mit GenAI angeht, bin ich sehr zwiegespalten und der kritische Blick ist enorm wichtig. Und siehe zB den Augen auf/zu Teil hast du den ja.

Daher wundert es mich gerade doch extrem, dass du das Ergebnis in dem Fall für vertretbar hältst. Die beiden Speisekarten sind doch komplett unterschiedlich! Nicht nur da, wo das Original unscharf war, Gemini hat die vollständig umgeschrieben und das Ergebnis ist mMn völlig wertlos.

Stefan
Stefan
12. Januar, 2026 13:59
Reply to  Torsten Dewi

Ich sag ja auch nicht "uh.. gefährlich, was der Dewi hier macht!", ein Experiment ist ein Experiment, mach ich ja genauso. Aber deine Wertung "bis auf ein paar Schreibfehler klappte das super" ist schon sehr krude, denn das ist nicht, was als Ergebnis dieses Experiments zu sehen ist.

Sei’s drum, ich find das Thema spannend und den kritischen Blick wichtig. Ich fürchte, die meisten Menschen haben nicht halb so ein aufmerksames Auge, wie du es bei den ganzen anderen Fotos angelegt hast. Daher zwiegespalten. GenAI interpretiert Dinge in die Bilder, die da nicht sind. Und je stärker die Vergrößerung oder Entrauschung, desto mehr zwingt man sie, konkrete Details zu erfinden. In dem vorherigen Post hattest du ein Bild, in dem jemand eine Uhr trägt. Da war jetzt nichts besonderes zu sehen, aber es ist ein schönes Beispiel: Wenn ich genug vergrößere/restauriere, zwinge ich die KI irgendwann, entweder eine kaputte Uhr zu generieren oder ein Uhrzeit zu erfinden. In beiden Fällen ist das Ergebnis ziemlich sicher historisch falsch. Das finde ich schwierig. Halte aber auch die Gegenfragen "Ist das relevant?" oder "Ist die menschliche Erinnerung authentischer?" für absolut relevant. Daher: spannendes Thema.

Peter Krause
Peter Krause
12. Januar, 2026 18:08
Reply to  Stefan

Ich finde das Speisekartenbeispiel vor allem spannend (und verwirrend), wenn man nachzuvollziehen versucht, wie die KI denkt. Während an einer Stelle aus eigentlich recht gut lesbarem Text komplett unverständliches Gebrabbel wird (wie bei der Beschreibung der Teigstärke "Donatos Extradünn"), demonstriert sie an anderer Stelle prinzipielles Textverständnis, hält aber eine Umformulierung für nötig ("Pepperonisalami nach amerikanischer Art" wird zu "Peperoniwurst eigener Receptur") oder eine Geschmackskorrektur ("Zimt auf Pizza? Igitt, das sollte bestimmt Krioblauch heißen!"), und im unteren Viertel weiß sie zwar, worum es geht, scheint aber das Original nur noch vage im Gedächtnis zu haben und ersetzt Inhalt, Aufbau und Design fast vollständig. Die wiederholten "Extraböden" mit ihrem Preis(?) unter 1€ (dem dann natürlich ein kryptisches Zeichen vorangestellt werden muss) scheinen wirre Erinnerungsfetzen aus einer Pizzeria eines Möbelhauses zu sein (wo sonst könnte es Extraböden geben?), wobei sie von Zeile zu Zeile unsicherer wird, ob das r wirklich ein Diakritikon braucht.
Bei den umkringelten Nummern der Pizzen frage ich mich, ob sie die für ein reines Designelement hält. Und warum musste der rechte Rand so sehr beschnitten werden, dass nicht mal mehr Platz für die Euro-Zeichen ist?

Last edited 29 Tage zuvor by Peter Krause
Nummer Neun
12. Januar, 2026 14:53

Im letzten Jahr hatte ich mit ChatGPT versucht, ein Bild aus dem Biergarten zu verändern. Konkret sollte ein einzelnes Detail verändert werden. Dass der Rest unangetastet bleiben sollte, promptete ich natürlich nicht.

Das Ergebnis: Das Detail war wie gewünscht verändert, aber die anderen Gesichter stimmten nicht mehr. Das gruseligste war aber: Die Biergläser wurden verändert. ChatGPT hatte tatsächlich eine Art Hofbräu-Logo drauf gekleistert, wo vorher ein Augustiner Bierglas war.

Ein anderes, positives Beispiel: Ich hatte ein aktuelles Bild von meinen Eltern genommen und sie durch Muppet-Figuren ersetzen lassen, um ihnen zu zeigen, was KI alles kann. Das Ergebnis ist wirklich wunderbar geworden und ich habe meine Eltern lange nicht mehr so lachen gesehen, als sie das Ergebnis bekommen haben. Das Bild liegt jetzt ausgedruckt bei ihnen zu Hause.

Christian Siegel
12. Januar, 2026 15:52

Das ist die ideale Gelegenheit, um dir für deine Berichte zu deinen Erfahrungen KI – insbesondere in der Bildbearbeitung – zu danken. Aufgrund deiner Artikel habe ich ChatGPT kürzlich selbst das erste mal angewendet, einerseits um neue Bilder zu erstellen, und andererseits, um den Schriftzug von Postern zu entfernen. Ohne dich wäre ich wohl überhaupt erst gar nicht auf den Gedanken gekommen. Insofern vielen Dank für die Inspiration! 🙂

Martzell
12. Januar, 2026 15:53

Sehr interessant. Dass Gesichtsausdrücke und Inhalte verfälscht werden ist mir auch schon aufgefallen. Vor einigen Jahren wurde darüber berichtet dass Fotos der Opfer der Roten Khmer mit KI restauriert und koloriert wurden und die auf den Fotos dann eher lächelten, was sie auf den Originalfotos aufgenommen in Vernichtungslagern nicht taten.