Das Grauen der Groschenhefte: In den Klauen der KI-Kreatur
Themen: Film, TV & Presse, Künstliche Intelligenz |Disclaimer: Dieser Beitrag fußt komplett auf einer Annahme, die falsch sein könnte. Sollte das der Fall sein, werde ich das augenblicklich vermelden und mich bei allen Beteiligten entschuldigen.
Im Dezember 2021, als von MidJourney, ChatGPT und dem ganzen anderen KI-Kram noch gar nicht die Rede war, berichtete ich erstmals von einer sehr rudimentären KI-Software namens wombo.art (mittlerweile WOMBO Dream). Nach heutigem Maßstab fast schon lachhaft, aber damals durchaus faszinierend, konnte die App mit ein paar Stichwörtern und einem vorgegebenen Stil teils bizarre, alptraumhafte Grafiken generieren:
In einem weiteren Beitrag stellte ich die These auf, dass sich wombo prima dafür eignen würde, Cover für Horrorromane zu erstellen, die ja per Definition eine alptraumhafte Atmosphäre brauchen und deren Qualität in den letzten Jahren zeitweise massiv abgenommen hatte:
Ich wiederhole mich, aber ja – ich glaube, dass das ausdrucksstarke und als Basis für Romancover absolut taugliche Artworks sind. Mich erinnert das an Barker, Poe, Lovecraft und andere stimmungsstarke Autoren. Man könnte sich ein wenig professionelle Hilfe holen und eine Figur oder eine Kreatur einbauen, um die Verbindung zum Leser zu stärken. Das ist optional.
Für diese freche Idee bekam ich in den Kommentaren viel Gegenwind.
Mit MidJourney wurden die Karten erneut neu gemischt, denn anders als bei wombo ist man hier nicht an die Stilvorgaben der Software gebunden. Mit ein wenig Expertise kann man MidJourney dazu bringen, sich den Traditionen des Heftromans weitgehend anzupassen. Und so machte ich mir den Spaß, ein Fake-Cover des John Sinclair-Romans zu basteln, den ich immer mal schreiben wollte:
Das sieht schon EXTREM nach dem Stil der Sinclair-Romane aus, die ich in den 80ern gelesen habe. Vielleicht schreibe ich den Roman doch noch…
Nun werden branchenweit die Grafiker natürlich nervös. Nicht nur, weil die KI mittlerweile exzellente Arbeit abliefert und nie meckert oder Urlaub nimmt – die KI bietet vor allem ein unschlagbares Preis/Leistungs-Verhältnis. Sie generiert auf Wunsch ein Dutzend Vorschläge, arbeitet klaglos wieder um, lässt sich auch rückstandslos entsorgen – alles an einem Nachmittag und für Centbeträge. Das KANN kein professioneller Grafiker bieten.
So sieht das auch Redakteur Michael Schönenbröcher von Bastei in einem Posting auf Facebook, das gerade mal gut drei Wochen alt ist:
Es ist schon traurig, wenn Facebook zwei Beiträge vorschlägt, die wieder einmal deutlich machen, wie sehr echte Künstler von der KI überholt werden. Warum sich tagelang die Arbeit machen, ein wirkliches Kunstwerk zu schaffen, wenn es auch mit der Eingabe einiger Begriffe innerhalb von Minuten geht und das Ergebnis zwar ohne Seele ist, aber ein Vielfaches an Interesse und Zustimmung bekommt? Auf diese Weise verlieren kreative und handwerklich begabte Menschen zunehmend an Wertschätzung.
Eine Kennung wie ein Wasserzeichen für diese Computerbilder ist das Mindeste, was man den echten Künstlern zugestehen muss!
Nun kann man über die “Seelenlosigkeit” von KI-Artwork durchaus diskutieren – sind solche “traditionellen” Cover beseelter? Ich musste da eher kichern:
Online üben Verlage und Grafiker den Schulterschluss, vielerorts versichert man einander Solidarität und die Fortführung der guten Zusammenarbeit.
Das ist naiv.
Den Verlagen geht es immer schlechter und es wird gespart, wo gespart werden kann. Die KI ist nicht nur die Möglichkeit, mit weniger Aufwand ein Cover zu bestücken, sondern auch wieder zur überlegenen Ästhetik der früheren Jahre zurückzufinden.
Und wie aufs Stichwort erscheint der neue Zamorra Roman Band 1279:
Ich fühle mich gerade ein bisschen wie ein Prophet.
Das ist KI. Ich gehe sogar einen Schritt weiter: es ist nicht mal MidJourney, sondern eine Variante der längst überholten Wombo-App. Der Stil ist weitgehend unverwechselbar. Dabei ist es nur eine amüsante Fußnote, dass Bastei praktisch das gleiche Thema wie ich für sein KI-Cover gewählt hat.
Es wird wohl auch im Heft kein Urheber bzw. Grafiker genannt.
Um noch einmal zu verdeutlichen, wie einfach es ist, ein Cover wie das obige von einer KI erstellen zu lassen, gebe ich bei MidJourney folgenden Prompt ein:
painting of a scary Victorian demon train from hell running through the night, –v 5.1
Das Ergebnis nach gerade mal 30 Sekunden:
Neugierig geworden, schaue ich nun bei Kollege John Sinclair nach – und auch hier würde ich einen Kasten Bier wetten, dass man die Arbeit der KI überlassen hat:
Meine Vermutung: Hier war nicht der arrivierte Sinclair-Gestalter Timo Würz am Werk. Auch nicht Wombo. Das riecht eher nach MidJourney. Typisch sind die mangelnden und verzerrten Extremitäten der Figur, die unnatürlichen Proportionen.
Ich betone es noch mal: Ich kann mich irren. Aber ich glaube es nicht.
Was macht man, wenn man den Job des Journalisten gelernt hat und nicht blind drauflos spekulieren will? Recherchieren und bei der Quelle nachfragen. Erfreulicherweise kenne ich Michael Schönenbröcher noch aus der Zeit, als ich Jerry Cotton vor über 20 Jahren zu einer neuen TV-Franchise umschmieden wollte. Habe ich das eigentlich schon mal erzählt?
Egal, Schönenbröcher antwortet auch am Sonntag schnell und freundlich. Dass es sich um KI-Cover handelt, kann er weder bestätigen noch dementieren. Er führt allerdings an, dass der Verlag eine Flatrate beim Anbieter Shutterstock habe. Das ist branchenüblich, da kann man sich ohne weitere Kosten aus Millionen von Motiven bedienen.
Weiter bohren. Siehe da – Shutterstock ist ebenfalls längst in das KI-Geschäft eingestiegen. Man bietet KI-generierte Bilder an und demnächst auch einen KI-Generator, der basierend auf Vorgaben individuell produziert. Der Vorteil gegenüber MidJourney ist dabei angeblich die rechtliche Absicherung in Sachen Copyright und Bildrecht. Angeblich deshalb, weil die gesamte Branche zu dem Thema noch schlingert.
Sei es, wie es sei: Bastei hat (so ich mich nicht irre) den Damm gebrochen und KI-Cover verwendet, ob wissentlich oder unbewusst. Da diese preiswerter und in meinen Augen auch besser als viele Auftrags-Artworks sind, kann ich mir nicht vorstellen, dass das ein einmaliger Ausrutscher war/ist/bleibt. Es ist – und ich meine das wert(ungs)frei – die Zukunft. Und was immer man an der Artwork auch kritisieren mag (mangelnde Individualisierbarkeit, Defizite bei der Darstellung von Menschen), ist eine Frage von Monaten, eher von Wochen. Das wird hingebogen.
Etwas überrascht bin ich, dass die aktuellen Cover von PERRY RHODAN nicht nach KI aussehen, denn Science-Fiction ist für MidJourney erheblich leichter zu generieren als Horror oder Fantasy:
Auch hier habe ich nachgefragt, und zwar bei Klaus Frick, dem Verlagslektor und Redakteur des Pabel-Moewig-Verlags, der für PERRY RHODAN zuständig ist. Für ihn kommen KI-Cover aktuell nicht in Frage:
“Bei PERRY RHODAN geht es ja doch darum, die Romane zu illustrieren, und eine KI kann aufgrund einer Beschreibung im Roman oder im Exposé keine eigenständige künstlerische Leistung erbringen.”
Nun haben wir über mich als Konsumenten gesprochen und mit den Verlagen als Produzenten – aber was ist mit den Grafikern, die ihre Aufträge davon schwimmen sehen? Hier brechen ganze Berufszweige ein, auf multiplen Ebenen. Also habe ich die Entscheidung getroffen, auch einen Betroffenen aus dieser Ecke zu befragen. Wer böte sich da besser an als Autor/Grafiker Michael Marrak, der mich im letzten Jahr erstmals auf die Idee brachte, mich mit dem Thema MidJourney zu beschäftigen? Michael hat gerade die metropolCon in Berlin hinter sich gebracht, erklärte sich aber trotzdem bereit, sich zu äußern. Ich packe das mal in einen eigenen Bereich.
Interview Michael Marrak
Zu den KI-Covern bei Bastei gibt sich Marrak wertneutral:
“Sagen wir mal in Kürze so: ZAMORRA tun KI-generierte Titelbilder gut, denn die der letzten Jahre waren teilweise so schlecht, dass es weh tat. Wirklich weh tat. Sage ich jetzt als ZAMORRA-Leser und Fan der Frühzeit.”
Die konkrete Umsetzung hält er – wie ich – noch für suboptimal:
“Selbst für ein MidJourney-Cover hätte man aus der KI für das Thema “Zug des Grauens” noch weitaus mehr herausholen können. Das, was man sieht, ist nur irgendein Wischiwaschi, das als Zug erkannt werden könnte. Wo das “Grauen” ist, sehe ich nicht. Prompts sollte eben auch von fantasievollen Leuten erstellt werden.”
Wenn wir schon bei der Zug-Analogie sind – der lässt sich nicht aufhalten und die Endstation ist noch lange nicht in Sicht:
“Der Geist ist aus der Flasche. Wir müssen lernen, mit ihm zu leben. Und es wird immer Menschen geben, die Handgemachtes dem Maschinengenerierten vorziehen. Nur: wie sollen wir das irgendwann noch erkennen? Die ganze Sache ist kaum ein Jahr alt, schau dir die rasanten Entwicklingssprünge von MJ 4.0 zu MJ 5.2 an. Und es ist immer noch die Beta-Phase.”
Siehst er sich selbst als Betroffener in Sachen “KI ersetzt alle Kreativberufe”?
“Ersetzt? Warten wir ab. Es ist ein Werkzeug, und wie bei jedem Werkzeug gibt es die Generation, die aufschreit (wir), und die Generation, für die das dann normal sein wird (die nächste). Es ist wie bei der Malerei und der Fotografie, wie beim Stummfilm und dem Tonfilm (Zitat: “Wer will Schauspieler sprechen hören?”), wie bei der Kutsche und dem Automobil.”
Das Problem sieht er eher in der Demokratisierung der Mittel, die zu einer Flutung des Marktes mit minderem Content führt:
“Das Problem diesmal ist, dass JEDER Zugriff auf das neue Werkzeug hat, und nicht wie früher nur befähigte, ausgebildete Leute. MJ ist schon jetzt das Werkzeug der Blender. Wir haben plötzlich ganz viele Zauberer von Oz.”
Schwierig wird es laut Marrak auch in ganz anderen Bereichen:
“Ich fürchte, es wird noch schlimmer kommen, da die Mechanismen des “Betrugs” immer mehr verfeinert werden – sowohl im Text- als auch im Bildbereich. Man denke an die mittels KI generierten Fotos von der “Festnahme von Donald Trump”. Von Deep Fake ganz zu schweigen, wobei jeder betroffen sein kann, der eine öffentliche Person ist und von dem oder der es Fotos im Netz gibt.”
So viel dazu. Ich halte das für eine weitgehend realistische Bestandsaufnahme – die natürlich keinen Grafiker, Fotografen oder Übersetzer beruhigt, dem gerade die Aufträge wegbrechen.
Es ist übrigens nicht mein Interesse, Bastei oder irgendwen mit diesem Beitrag an den Pranger zu stellen. Ich halte KI-Cover für eine spannende Entwicklung und teilweise eine Verbesserung in einem Genre, das in den letzten Jahren ziemlich gelitten hat. Es geht mir eher darum, eine Diskussion anzuschieben, wie haltbar diese “Grafiken von der KI sind doch seelenlos”-Behauptungen sind. Wer definiert dieses “seelenlos”, wenn man eine gut gemachte KI-Artwork längst nicht mehr von einer “echten” Artwork unterscheiden kann? Und was sind die Versprechen von heute, den Grafikern die Stange zu halten, morgen noch wert?
KI is here to stay. Get used to it.
P.S.: Das Vorschaubild zu diesem Beitrag ist natürlich ebenfalls von MidJourney generiert. Ich nutze die Möglichkeiten der Software allerdings nicht nur aus ästhetischen, sondern aus rechtlichen Gründen. MidJourney hat bisher noch nie versucht, mich abzumahnen.
Sehr spannend. Aber wir sollten lieber zuerst nochmal die Diskussion führen, warum du immer “die Artwork” schreibst, obwohl es doch “das Artwork” heißen muss. :p
Sprache lebt von Veränderung und ich bin ein Rebell.
Bei Auftragsarbeiten kommt vieles auf die Kommunikation an, wie deutlich äußert der Kunde seine Wünsche, interpretiere ich die richtig, wie hoch ist die Frusttoleranz des Kunden.
Wenn jeder Kunde denkt “das mache ich selber”, wird das bei vielen gelingen, bei einigen nicht, die das aber fluchend so hinnehmen werden, weil billig genug.
Es wird aber immer auch andere geben, die genau wissen was sie wollen, das der KI aber nicht vermitteln können, denen ihre Zeit wichtiger ist als der Preis.
“Es wird aber immer auch andere geben, die genau wissen was sie wollen, das der KI aber nicht vermitteln können, denen ihre Zeit wichtiger ist als der Preis.” – das gilt aber nur so lange, bis die KI so gut zuhören kann wie du.
Spanned dazu das Video von Tom Scott “I tried using AI. It scared me.”
In dem legt er schön dar, wie er mit ChatGPT ein kleines Programm zum labeln seiner E-mails schreiben wollte.
Es war nicht unbedingt schneller und es musste auch immer noch aus verschiedensten Gründen nachgebessert werden, bis man das korrekte Ergebnis hatte (teilweise aus Googleprogrammfehlergründen, teilweise aufgrund Bedienung und Lerneffekt), aber es war, wie mit einem Kollegen zu arbeiten. Ein Kommunikationsprozess, der um vieles leichter war, als sich die nötigen Programmzeilen selbst zusammenzusuchen.
Zur Zeit braucht es noch Programmierwissen, um ChatGPT anzuleiten, aber wir stehen kurz vor Star Trek und “Computer, ich brauche ein Programm, das X macht.”
Programmieren wird im Ergebnis jedem zugänglich, in Form eines Gesprächs.
Ist ja schon mehrfach angedacht worden, dass der Beruf des Prompters, also desjenigen, der besonders geschickt die richtigen Begriffe zusammenstellt, durchaus Potential hat.
Und wer professionell Bilder nachbearbeiten kann wird immer einen Vorteil haben.
Das hat nicht nur Potenzial – das wird überall gesucht. Prompter ist ein legitimer Beruf.
Ach, ich bin da hinter der Zeit.
Ich warte aber auch drauf, dass der Autorenstreik in US mit dem Totalersatz durch ChatGPT ausgeht. South Parks Experiment war da durchaus interessant.
Ich hatte mir mal vor ein paar Wochen die KI einer großen Bildagentur angesehen. Die Ergebnisse sind unterirdisch, Auflösung mickrig und je Bild wurden, wenn ich mich nicht irre um die 100€ fällig, da KI Bilder nicht in der Flatrate (die wir haben) enthalten sind. Würde mich nicht wundern wenn dort die eigene KI aufgegeben und ne Kooperation mit einem bestehenden Entwickler eingegangen wird.
KI-Artworks haben sich bislang noch nicht auf meinen Job ausgewirkt. Ich lebe allerdings auch nicht davon, ein fertiges Bild abzugeben und Ende – meine Illustrationen müssen bearbeitbar sein. Wenn ich für Konsolenspiele Cover erstelle, dann müssen diese Ebenen besitzen für Hintergrund, Figuren, Wolken, Landschaftsmerkmale etc., alles editier- und verschiebbar, weil das Artwork mal als Quadrat funktionieren muss, mal als Panorama und mal als hochkantiger Banner, und alle Elemente müssen eben frei platzierbar sein. Ein KI generiertes Artwork besitzt aber – vermute ich? – nur eine einzige Ebene, alles hat seinen festen Platz, und wie soll das für meine Auftraggeber nutzbar sein. Änderungswünsche wie “Die Hauptfigur muss kleiner” oder “Mach mal aus der Wiese eine Ackerlandschaft” kommen gern auch noch dazu.
Das alles ist sicher kein Argument gegen KI-Illustrationen, aber wie gesagt, in meinem Fall ist die Bearbeitbarkeit das aktuelle Hauptargument dagegen. Mal schauen, ob das so bleibt.
Das sind die bekannten Defizite der KI, an denen aber bereits gearbeitet wird – Adobes Firefly erlaubt z.B. die nachträgliche Justierung von KI-Grafiken.
Es wäre sicher auch schon möglich, die einzelnen Elemente einer Illustration erst mal einzeln KI-generieren zu lassen – zack, könnte man daraus eine Illustration “zusammenbauen” und sie würde bearbeitbar bleiben. Mein Job wäre dann die Verarbeitung, was für die Effizienz vielleicht gar nicht so schlecht wäre. Schon heute kollagiere ich viel, wenn es um Texturen oder Effekte geht. Es wird spannend, wie sich das in den nächsten Jahren verschiebt.
So machen das viele Webdesigner – die lassen sich von der KI ein visuelles Konzept und eine Farbchoregraphie entwerfen, die sie dann in konkrete Elemente umsetzen.
Die nächste Photoshop-Version wird eingebaute KI besitzen, hab grad beeindruckende Montagen gesehen, in denen ganze Bildabschnitte errechnet wurden auf Grundlage der Vorlage. Das kann Photoshop schon länger, aber in DEM Ausmaß ist das heftig. Alternativ gibt es DraGAN, das muss ich mir auch mal näher anschauen – einfach krass: https://twitter.com/AiBreakfast/status/1659601613739409409
Ich hatte am Anfang meiner Karriere noch ganz analog (mit Stift und Pinsel) als concept artist (bei Ice Planet) gearbeitet und mir gefiel schon der Wechsel auf Photoshop und Grafiktablett nicht – ich hab mich dann gleich auf 3D-Art umorientiert. Die allein digitale Existenz eines Kunstwerks stellt in meinen Augen bereits einen erheblichen Minderwert dar, das hier ist jetzt nur die weitere Konsequenz. Ich sehe in KI deshalb für mich auch weniger eine Bedrohung als ein faszinierendes und hilfreiches Tool für den Job, das viel Arbeit erspart. Ich erwarte mit Spannung die weitere Entwicklung, z.B. im 3D-Bereich. Der Job hat sich in den letzten 20 Jahren bereits drastisch weiterentwickelt, generell ist die Akzeptanz für neue und effiziente Techniken hier hoch und man passt sich rasch an. Das Berufsbild mag sich ändern, aber es wird nach wie vor genug manuell zu arbeiten geben, und wenn es nur um Erschaffung und Kontrolle von KI-Assets geht.
Das Verschwinden “analoger” Originale bedauere ich auch – weshalb ich solche ja sammle (Artwork, Autogramme, Comicseiten). Die Idee, dass diese Originale nicht beliebig kopiert werden können, sondern einzigartig sind, ist mir wichtig.
Dafür wurde ja NFT erfunden…
Yeah… no.
Böse Zungen behaupten ja, daß der Kunstmarkt (insbesondere moderne Kunst) hauptsächlich zum Waschen von Schwarzgeld da sei, NFT setzt dem ja nochmal die Krone auf.
Danke für diesen schönen Beitrag! Ich bin gespannt, wann ich als Autor mit einer (guten) KI konkurrieren muss.
Gruss Uwe Hermann
Das mag schneller gehen, als du denkst:
20 Experimente mit ChatGPT: Der universalgelehrte Depp – Wortvogel
Darum dreht sich ja z.T. auch der Hollywood Autorenstreik.
Was ich mich immer mehr bei dieser Thematik frage ist, wo soll die Energie für all die Datenmengen und Server die die KI braucht herkommen?
Je komplexer die KI-Systeme desto mehr Server desto mehr Elektrizität und Kühlwasser-Verbrauch.
Wenn alle 8 Milliarden Weltbevölkerung digital unterwegs sind, wie soll das funktionieren?
8 Milliarden sind es noch nicht, aber wohl 5 Milliarden. (Quelle: https://wearesocial.com/de/blog/2022/04/mehr-als-5-milliarden-menschen-nutzen-jetzt-das-internet/ )
Kurz zusammengefasst (via copy paste):
Okay – beantwortet aber nicht die Frage woher die Energie für immer größere Server herkommen soll die die KI am “Leben” erhält und immer weiter aufgeblähte Clouds speichert?
Ich halte die Frage für falsch, weil zu einseitig – die Verwendung von Computern reduziert an anderen Stellen den Energieverbrauch. Ich habe neulich mal ausgerechnet, was in unserem Haushalt den Strom frisst. Früher waren das Stereoanlagen, Videorekorder, etc. Das gibt es heute alles nicht mehr, weil das komplett über das Notebook läuft. Und Sachen wie Zoom machen immer mehr Dienstreisen und Autofahrten unnötig. Man müsste demnach eine Rechnung aufmachen, wie viel Strom die neuen Techniken sparen und das mit ihrem Verbrauch aufrechnen.
Die Prozessoren werden ja immer auch leistungsfähiger und verbrauchen somit weniger Strom für die selbe Aufgabe
Auch das kommt hinzu.
Ich halte deine Antwort für falsch weil ebenfalls zu einseitig.
Wir haben weltweit mit immer mehr digitalem Datenmüll zu tun der gespeichert wird.
Beispiel – in meinem Bekanntenkreis sind Menschen die längst verstorben sind, aber deren Social-Media-Blogs immer noch einsehbar im Netz gespeichert sind. Bis zum Sankt-Nimmerleins-Tag.
Und es wird täglich mehr.
Kein Mensch löscht die uralten Bilder und Daten.
Man muss nur auf Youtube schauen. Das meiste was dort gespeichert wird und jeden Tag mehr Energie und Speicherplatz verbraucht ist reiner Schwachsinn.
Früher langweilte Onkel Herbert einmal im Jahr die Familie mit seiner Dia-Schau. Seine Erben haben den Kram dann entsorgt.
Heute klebt Onkel Herbert mit seiner langweiligen Dia-Show im Netz. Zusammen mit geschätzen 3,5 Milliarden anderen Energieverbrauchern die die das millionste Foto vom besten Hot-Dog in New York gepostet haben.
Du denkst immer noch zu kurz. Zuerst einmal wird natürlich eine unfassbare Menge an Digitaldaten gelöscht. Jede kaputte Festplatte, jeder ausgemusterte Rechner. Die Cloud bzw. das Netz sind ebenfalls keine Müllhalden. Vor allem aber: selbst WENN so etwas wie YouTube massiv Energie verbraucht, halte ich es für ein schützenswertes “Weltgedächtnis”. Wer so etwas abkanzelt, kann auch gleich Stadtbüchereien dem Altpapier übergeben. Wer braucht die schon? Wir scheinen sehr unterschiedliche Vorstellungen vom Wert des Digitalbestandes zu haben.