wombo.art: Künstliche oder Kunst-liche Intelligenz?
Themen: Künstliche Intelligenz, Neues |In den letzten Tagen wurde ich immer wieder auf wombo.art hingewiesen – eine App, die mit KÜNSTLICHER INTELLIGENZ basierend auf willkürlichen Stichworten eine Art “Gemälde” errechnet und es mit einem Filter im Stil von Prisma versieht.
Interessant sind dabei die technischen Details der APP – da die KI jedes Mal neu berechnet, ist jedes Bild ein absolutes Unikat, nicht reproduzierbar. Nehmen wir das hier mit den Stichworten Dschungel, Laser und Ritter:
Klicke ich auf “zurück” und drücke den “create”-Button erneut, kommt das heraus:
Gehe ich zurück und aktiviere den Synthwave-Filter, sieht es so aus:
Und hier im japanischen Ukiyo-e-Stil:
Die Bilder liegen in einer Auflösung von grob 950 x 1500 Pixeln bei 72dpi vor. Gut genug fürs Internet und für digitale Cover – für echten Druck müsste man sie hochrechnen, was ja mittlerweile durchaus möglich ist. Hier ein Bild, das ich dergestalt auf dreifache Größe gebracht habe:
Alles gut und schön, aber letztlich wollte sich mir der Sinn dahinter nicht erschließen – was fängt man mit ästhetisch teilweise überzeugenden, aber auch vagen und letztlich inhaltslosen Grafik-Gemälden an? Nur, weil’s schön ist?
Aber dann mischten sich diverse Autoren ein, u.a. Kai Meyer, die mal spaßeshalber zu eigenen Romanen mit der App neue Cover errechnen ließen. Die Ergebnisse waren teilweise erstaunlich und auch sehr atmosphärisch. In einem Buchladen würden sie mich tatsächlich ködern.
Und damit kommen wir zu dem Bereich, in dem wombo.art vielleicht tatsächlich ein Gamechanger ist – wir leben schließlich in einer Zeit, in der tausende selbstbesoffene Möchtegern-“Autoren” ihre Werke in die Welt hieven, gerne versehen mit Covern, die mangelnde Kenntnis im Umgang mit Microsoft Paint oder wenigstens Wachsmalstiften verraten. Es gibt nicht ohne Grund Sammlungen der “worst of the worst”:
Hier kann wombo.art helfen, hier kann die Künstliche Intelligenz schaffen, woran die menschliche Kreativität gescheitert ist: schnell, einfach und kostenlos Buchcover produzieren, die halbwegs Inhalt und Stimmung eines Romans repräsentieren und sich kommerziell verwerten lassen.
Natürlich hat das System deutliche Grenzen. Abgesehen von der gefälligen Ästhetik sind die Artworks extrem unkonkret, vermitteln bestenfalls eine Ahnung eines Themas. Tiere und Menschen sind nicht direkt darstellbar und je realistischer die Grafik sein soll, desto mehr scheitert die App. Für Fantasy und Science Fiction ist das prima. Bei Horror wird es schon eng, weil eine Bedrohung nur sehr vage visualisiert werden kann:
Ein schönes Beispiel ist auch dieses Motiv, mit dem ich eine Artwork für einen Kriminalroman simulieren wollte:
Geht. Irgendwie. Aber gut ist anders.
Wer im Bereich Erotica unterwegs ist, sollte die App komplett meiden – it’s the stuff of nightmares:
Dennoch bin ich von wombo.art fasziniert und begeistert – fast genug, um selber mal wieder einen Genre-Text zu schreiben und mit einem KI-kreierten Cover zu versehen. Es mag auch daran liegen, dass die Cover, gerade weil sie so ambivalent sind, die Phantasie anregen. Sie erlauben einen Blick in unwirkliche Welten, die man leicht mit dem mangelnden Leben füllen möchte.
Ich habe zu Testzwecken einfach mal ein paar Stichwörter zusammen geworfen und geschaut, was dabei rauskommt: Ninja und Roboter, Weltraum und Hochhaus, Wüsten und Werwölfe. Lasst euch überraschen:
Zumindest im semi-professionellen Bereich kann das absolut mitspielen.
Hakelig ist momentan allerdings die rechtliche Grundlage. Die “terms of service” reden nur davon, dass der Service und alle seine Bestandteile geschützt sind. Kann man die Artworks demnach frei verwenden? Das ist zumindest ungeklärt. Aus dem Bauch heraus würde ich unterstellen, dass sich kein Urheberrecht daran festmachen lässt. Vielleicht wird das zeitnah konkretisiert.
Wie seht ihr das? Spannendes Spielzeug für Leute, die sich keine ordentlichen Grafiker leisten können? Schnickschnack, den man installiert, ausprobiert, und dann vergisst? Oder weiterer Baustein der Dystopie totaler Maschinenkontrolle, die langsam nicht nur lernt, was wir sagen, sondern auch, was wir meinen?
Faszinierend finde ich’s auch, aber praktische Verwendbarkeit ist eher dürftig. Denn: wer diese hässlichen Paint-Buchcover erstellt, der wird auch aus AI-Kunst genau die falschen Entwürfe auswählen, weil jegliches Verständnis für Ästhetik und Bildsprache fehlt.
Da wäre viel mehr mit einer AI geholfen, die nach Stichpunkten sinnvoll Stock Photos auswählt und mit einer ansprechenden Typo versieht (gibts bestimmt auch schon). Das würde uns zumindest vor Geschmacksverbrechen bewahren.
Einen denkbaren Zweck zeichnet Wombo Art direkt vor, indem es die Bilder als “Trading Cards” präsentiert: CCGs und auch sonst viele moderne Kartenspiele brauchen heutzutage schiere Unmengen an kleinformatigen Illustrationen. Für Fantasy Card Games ginge das super. Bekommen menschliche Künstler immer noch sehr viel besser hin, aber das Budget für 50, 100, 200 Illus muss ja auch erstmal da sein.
Aber das ist ja ne Mini-Nische.
Ach Wombo … die mit der Lipsync-Partyapp. An die erinnere selbst ich alter Sack mich noch. 🙂
War jetzt auch mal neugierig, weil es Torsten explizit erwähnt hatte, wie es in Sachen Copyright aussieht, das ja wohl ziemlich schwammig formuliert ist – und bin über einen Thread bei Reddit gestolpert, in dem die User das auch diskutiert haben. Einer der Nutzer hat ein bisschen damit rumexperimentiert (Keywords benutzt, die spezifisch auf seine eigene Website zugeschnitten waren) und hat in den Ergebnissen dann fast immer Material aus seiner eigenen Online-Präsenz wiedererkannt.
Es scheint also, als würde Wombo die Bilder (bzw. Bildanteile) einfach über eine Stichwortsuche in Google Images herunterziehen, was rechtlich ein bisschen … hm …. ich sag mal, diffus ist. Für kleine Fanarbeiten, Thumbnails oder Foren-Avatare geht das sicher noch irgendwie durch, für ein Werk, mit dem Geld verdient wird, fände ich es eher heikel.
Ist auf jeden Fall eine ganz hübsche Spielerei, wobei ich bei den Beispielen von Torsten zwar durchaus teilweise begeistert bin, mir aber vorstellen kann, dass man den bestimmten Mix-Stil dieser Montagen (also die DNA der AI) mit einer zunehmenden Anzahl von darauf basierenden Bildern wohl irgendwann ganz gut identifizieren kann, und damit solche Cover dann auch ganz schnell den “Ahh”-Effekt verlieren. Die von Torsten erwähnten Indie-Publisher/Autoren teilen sich da ohnehin in zwei Bereiche: Die, die so etwas benutzen könnten, sind die, die es ansonsten ja auch nur handzeichnen oder Paint-designen würden, während die Riege der in diesem Geschäft erfolgreichen Autoren auch weiterhin ganz normale Coverdesigner zwischen 500 und 1200 Euro rekrutiert. Der Markt ist diesbezüglich inzwischen ja schon weitestgehend professionalisiert.
Sind einige auf den ersten Blick faszinierende Bilder dabei. Auf den zweiten Blick sind alle Bilder arg fragmentiert, ohne Ebenen oder passenden Objekten die nicht verwischen mit anderen Bildteilen.
AI kann schon längere Texte verfassen die auf den ersten Blick überzeugen, genauer gelesen aber nur unpassendes blabla. Jetzt noch Cover, bald werden Bücher automatisiert ausgespuckt.
Ich fände es ja spannend, ob sich der surreal-fragmentierte Look tatsächlich so aus dem Erstellungsprozess ergibt, oder ob der bewusst eingebaut wurde damit das Ergebnis futuristisch-artifizieller aussieht und/oder mögliche Quellen (die unterstellte Google-Bildersuche) verschleiert werden.
Ich denke, es ist eine Mischung aus beidem.
Vom Effekt her erinnert es an eine “weiche” Version hiervon:
https://www.reddit.com/r/interestingasfuck/comments/bghyv5/this_picture_is_designed_to_give_the_viewer_the/
Ich würde das unter Schnickschnack einordnen, da mir das selbst für den semi-professionellen Bereich nur eingeschränkt nutzbar zu sein scheint. Die Bilder ähneln sich auch sehr, würde daher vermutlich auch nur bei einem überschaubaren Nutzerkreis funktionieren. Nicht ganz klar ist mir, warum die Ergebnisse nicht reproduzierbar sein sollten.
Das sehe ich komplett anders. Im Vergleich zu den “worst cover”-Werken oben ist JEDE Verbesserung Gold wert – und die liefert wombo.art im genannten Rahmen auf jeden Fall. Die Bilder ähneln sich, weil ich generische Oberbegriffe eingegeben habe. Da kann man durchaus mehr Arbeit in mehr Vielfalt investieren. Und schließlich: die Ergebnisse sind nicht reproduzierbar, weil bei jeder Berechnung ein komplett neues Bild basierend auf Zufallsparametern generiert wird. Hatte ich aber auch erklärt.
Ich bezog mich da auf den Stil, da ähneln sich die Bilder unabhängig von den jeweils verwendeten Oberbegriffen. Magineer hat das ja auch angesprochen, geht um die “DNA der AI”.Ich
Was die Reproduzierbarkeit betrifft, hatte ich die Erklärung natürlich gelesen. Die besagt aber nur, dass die Bilder mit Wombo nicht mehrfach in identischer Form erstellt werden können. Das ist aber etwas anderes als Reproduzierbarkeit. Wombo greift zudem ja offensichtlich auch auf Suchparameter zurück (eingegebene Begriffe+Ergebnisse der Onlinesuche), was für mein Verständnis bedeutet, dass die Bilder folglich auch mit dem Programm reproduzierbar sein sollten, allerdings nach Zufallsprinzip und mit einer nahezu endlosen Zahl von Versuchen (wenn das Programm taugt). Ging mir da einfach um die Funktionsweise, aber auch da hat Magineer mittlerweile ja schon Erhellendes zu geschrieben.
Selbst zu den “worst cover” Beispielen sehe ich zudem nicht mal in jedem Fall eine wirkliche Verbesserung, aber das ist letztendlich Geschmackssache.
Wir definieren augenscheinlich den Begriff Reproduzierbarkeit verschieden.
Ja, denke, mich hat da in erster Linie die Formulierung “absolutes Unikat” irritiert.
Falls noch nicht bekannt, check mal das KI-Projekt Midjourney aus. Dagegen ist wombo.art ein feuchter Pups. Guck Dir einfach mal dieses Video an, da werden die wichtigsten Basics erklärt. Ich bin durch Zufall darauf gestoßen und so begeistert, dass ich nach der kostenlosen Test-Phase (25 Bildberechnungen sind frei) ein kostenpflichtiges Abo abgeschlossen habe, um noch weiter damit rumspielen zu können. Das macht absolut süchtig!
Ja, das ist insane. Damit werde ich mich auch noch auseinander setzen.
[…] mal wieder über KI-kreierte Kunstwerke gesprochen. Das ging von rudimentären Ansätzen wie bei Wombo bis zu komplexen “text to picture”-Systemen wie MidJourney. Die Ergebnisse faszinieren, […]