Schreibknecht KI: Worte wie Heu (2)
Themen: Künstliche Intelligenz, Neues |Im ersten Teil haben wir gelernt, wie mühelos die KI zu jedem Thema und jedem Genre Welten erschaffen und Multiple Choice-Abenteuer aus dem Ärmel zaubern kann. Heute gehen wir einen Schritt weiter, lassen Chat-Bots entstehen und die KI eigenhändig komplette Romane schreiben. Be afraid. Be very afraid.
AI Chat modern
Mit AI Chat kann kann sich einen eigenen Chat-Bot bauen und mit diesem dann Konversation betreiben. Ich habe mich mit dem Generator nun schon länger auseinander gesetzt und kann euch garantieren: ihr unterschätzt bei den ersten Experimenten seine Möglichkeiten. Wer will, kann Elvis oder Spock als Chat-Bot nachbauen, die eigene Mama oder den Personalchef der Firma, bei dem ein Bewerbungsgespräch ansteht. Mit ein bisschen Erfahrung lernt man die Attribute, die einen Chat-Bot der Vorlage sehr ähnlich klingen lassen. Es ist ein sehr spannender Lernprozess – und teilweise erschreckend, wenn der Chat-Bot auf einmal tatsächlich so klingt wie die Figur, der er nachempfunden ist.
Der Fantasie sind mal wieder keine Grenzen gesetzt: Ob man Interviewsituationen simulieren oder flirten lernen will, ob man Projektideen diskutieren oder soziale Experimente testen will – der Chat-Bot ist ein Gesprächspartner, der den User ernst nimmt und nicht über ihn urteilt.
Nachdem ich ein paar reale und fiktionale Charaktere für Chats rekreiert hatte, wollte ich mal was ganz anderes probieren – ein Science Fiction-Szenario, in dem der Chat-Bot die KI eines Raumschiffs repräsentiert, mir der ich (als Captain) im ständigen Zwiegespräch eine Konfliktsituation erlebe. So ein Art Star Trek als Dialogerzählung. Natürlich alles mit der heißen Nadel gestrickt und ohne jedes weitere Nachdenken.
Vorgegeben habe ich der KI folgende kurze Beschreibung:
Lexor is the AI of a futuristic system wide computer on the spaceship Iroquois in the 24th century. His main responsibilities are reporting on the ship’s systems and advising the commander of the ship in battle situations.
Captain Thomerson is a 55, tall and blonde. He is the commander of the spaceship Iroquois.
Für den Einstieg in die Geschichte gab ich knappe drei Zeilen vor:
Lexor reports a squadron of five Goutarian battle cruisers trying to surround the Iroquois. What ensues is a dialog between Lexor and Thomerson with the AI describing the situation and suggesting appropriate action.
Mit diesen wenigen Informationen konnte ich gleich in die Story einsteigen:
Captain Thomerson: Lexor, what is happening?
Lexor: Captain Thomerson, I have detected a squadron of five Goutarian battle cruisers on an intercept course. They are attempting to establish a containment field around the Iroquois.
Captain Thomerson: Hail them.
Lexor: *Hails the Goutarian squadron* Goutarian vessels, this is Captain Thomerson of the ISS Iroquois. Identify your intentions and stand down immediately.
Captain Thomerson: Any reaction?
Lexor: Negative, Captain. They are not responding to our hails. Sensors indicate they are charging their weaponry.
Captain Thomerson: Shields up. Plot a course out of their range.
Lexor: Shields are at maximum capacity, Captain. Course plotted and ready for execution.
Captain Thomerson: Get us out of here now.
Lexor: Engaging engines on your mark.
Captain Thomerson: Go!
Lexor: Engines engaged. Initiating evasive maneuvers.
Captain Thomerson: Report.
Lexor: We are successfully breaking the containment field. Goutarian cruisers are adjusting their positions in pursuit.
Captain Thomerson: Fire aft torpedo at the closest Goutarian ship.
Lexor: Aft torpedoes launched, Captain. Impact in 3… 2… 1…
Captain Thomerson: Status?
Lexor: Impact successful, Captain. The enemy cruiser has sustained significant damage but remains operational.
Captain Thomerson: Any ideas on how to deal with the other ones?
Lexor: Analysis suggests that the Goutarian ships are coordinating their attacks. They are trying to predict our evasive patterns. I recommend we randomize our evasive protocols to throw them off.
Captain Thomerson: Do it. Also send a distress signal asking the federation for assistance.
Lexor: Engaging randomized evasive protocols. Distress signal sent. It will reach the nearest federation outpost in approximately 10 minutes, 32 seconds.
Captain Thomerson: Shoot at the vessel again – we need to destroy one of them to show we mean business.
Lexor: Firing a second aft torpedo at the damaged Goutarian cruiser.
Captain Thomerson: Any effect?
Lexor: The second torpedo has hit its target, Captain. The damaged cruiser is now listing and venting plasma.
Captain Thomerson: Fire our phasers at the plasma to ignite it.
Lexor: *Firing phasers at the plasma vent* Phasers have ignited the plasma, Captain. The resulting explosion has caused the damaged cruiser to break into two pieces.
Captain Thomerson: Any survivors we can pick up?
Lexor: Sensors detect life signs on the debris of the destroyed cruiser, Captain. However, the other four vessels are closing in fast.
Captain Thomerson: Try to lock on to the life signs and transport them over.
Lexor: Engaging transporter. Life signs locked. Transport in progress.
Captain Thomerson: Send a medical team and some security to the transporter bay.
Lexor: Transporter successful, Captain. Four Goutarian survivors have been beamed aboard and are secured in the bay. Medical and security teams are en route.
Captain Thomerson: Hail the other Goutarian vessels on all frequencies. Let them know we have the survivors and destroying us will also kill them.
Zu meiner Überraschung entwickelt sich die Story danach sehr spannend und unerwartet weiter: Die Überlebenden des goutarianischen Schiffes bringen eine seltsame Krankheit an Bord, die alle Crew-Mitglieder bedroht. Ich entscheide, die entstehenden diplomatischen Spannungen von der Förderation mit dem goutarianischen Council verhandeln zu lassen, während ein weiteres Schiff der Föderation medizinisch aushilft. Es stellt sich heraus, dass der Angriff der Goutarianer auf eine versehentliche Grenzverletzung der Iroquois zurückzuführen war – ein Problem, das auf diplomatischer Ebene gelöst werden kann. So bringe ich dank meines geschickten Vorgehens die Geschichte zu einem guten Ende für alle Seiten und schließe mit diesem Dialog:
Captain Thomerson: I consider that a win. Lexor, give me a final analysis on how we handled the situation.
Lexor: *Performing a thorough analysis* Captain, our rapid response to the containment field attempt, effective evasive maneuvers, and precise targeting of the Goutarian ships demonstrated excellent tactical skill. The decision to randomize our protocols and deploy the phasers strategically was instrumental in disabling the first cruiser. Additionally, the quick deployment of the medical team and the cooperation with the Intrepid-F reflect well on our diplomatic and crisis management abilities.
Captain Thomerson: How would you rate us?
Lexor: Captain, on a scale of one to ten, I would rate our overall performance at an eight. There is always room for improvement in communication and the initial detection of the no-fly zone.
Captain Thomerson: Agreed. Put your report in the logs and send them to the Federation.
Lexor: Captain, the report has been compiled and is being transmitted to the Federation Command. It includes a detailed account of the engagement, medical emergency, and subsequent diplomatic actions.
Das ist alles bezaubernd star-trekkig – auch deshalb, weil ich in den Attributen der Geschichte bestimmte Vorgaben wie "futuristisch, militärisch, formell" gemacht habe, um den Stil der Roddenberry-Serien zu emulieren.
AI Story Generator
Kommen wir zum Prunkstück der Perchance-Generatoren. Der AI Story Generator ist ein phänomenales Beispiel dafür, wie KI und Mensch Hand in Hand arbeiten können. Die Bedienung ist sehr intuitiv, bietet aber gleichzeitig viele Möglichkeiten, die Kontrolle über die Story zu behalten oder die KI von der Kette zu lassen.
Der Einstieg ist immer eine Beschreibung der Figuren und der Story. Schon hier hat man die Wahl: extrem knapp fassen und der KI die Details überlassen oder genau vorgeben, wohin die Reise gehen soll.
Ganz Faule machen das Häkchen bei "one paragraph at a time" weg und lassen die KI einfach mal fabulieren. Wer den Generator lediglich als Werkzeug zur Erstellung einer klar vorgegebenen Story nutzen möchte, der lässt das Häkchen dran und entscheidet nach jedem Absatz, ob ihm die Richtung gefällt oder die KI den Absatz auf Knopfdruck nochmal neu formulieren soll. So lässt sich die KI sehr genau führen und anpassen.
Als Beispiel für den ersten Ansatz habe ich die KI gebeten, eine Horror-Kurzgeschichte im Pulp-Stil zu schreiben. Drei vier Zeilen über einen namenlosen Fremden, der in einer Western-Stadt mit dem Bösen konfrontiert wird, gab ich vor. Das Ergebnis ist vor allem stilistisch beeindruckend:
DEATH RIDES INTO TOWN
The moon was a sliver in the night sky, casting an eerie light over the dusty main street of the town with a population of 314. A solitary figure on a black horse emerged from the shadows, the creature’s hooves making no sound as it trotted towards the saloon, the only building with lights flickering through the windows. The townsfolk, accustomed to the whispers of the desert night, froze at the sight, their hearts thumping in their chests like a drumline’s bass drum.
The stranger swung his leg over the saddle and dropped to the ground, the creak of leather and jingle of spurs piercing the silence. His eyes, two piercing points of light, surveyed the saloon’s exterior before pushing the swinging doors open with a heavy hand. The saloon, usually a cacophony of laughter, shouts, and the clink of glasses, fell as silent as a tomb. The bartender paused mid-pour, his hand trembling slightly, and the card players' eyes darted up from their tables, their hands hovering over their weapons.
The stranger’s dusty boots echoed on the wooden floorboards as he approached the bar, his spurs chiming with each step. His clothes were worn, as if he had ridden a long way through unforgiving lands, but there was something about him that spoke of an unyielding determination. He placed a silver coin on the counter and spoke in a low, gravelly voice, "Whisky." The bartender, his eyes wide, hastily poured a shot and slid it over, his hand shaking so much that the glass rattled against the wood.
The stranger threw back the whisky, the fiery liquid doing nothing to warm the coldness in his gaze. He slammed the empty glass down and announced to the room, "Death has come to town." The air grew thick with tension, a palpable force that seemed to push against the walls of the saloon. He continued, his voice as steady as the tick of a clock, "Look around you. No mirrors. This place opens only when the sun goes down. You’ve invited darkness in, and now it’s too late."
Three ragged gunslingers at the far end of the bar snickered, their teeth glinting in the candlelight. They hadn’t seen fearlessness in anyone’s eyes for a long time, and the sight of it made their blood boil. One of them sauntered over, his hand hovering above the butt of his gun, and said, "Who the hell are you to come in here and talk like that?" The stranger, unfazed, leaned back and drawled, "I’m the one with enough silver bullets to make sure the next time you wake up, you don’t." The room held its breath, the only sound the sizzle of a candle’s flame.
With a suddenness that seemed to defy the very laws of physics, the stranger’s hand shot to his holster and pulled out a gleaming revolver. The gunslingers' smirks faded as the silver glinted in the firelight, revealing their true nature. Fangs bared, they lunged towards him, but he was already moving, firing with a precision that spoke of years of practice. They fell one by one, their bodies writhing and smoking, as the silver pierced their undead hearts. The patrons watched in stunned silence, unable to believe what they were seeing.
The stranger holstered his gun and took a final sip of whisky, his eyes sweeping over the horrified faces of the townsfolk. "Remember," he said, his voice a low warning, "don’t let darkness into your town, or death will come for you next." With that, he turned on his heel and strode out, the saloon doors swinging shut behind him. The sound of his horse’s hooves faded into the night, leaving the people of the town to contemplate their fate and the terror that had just ridden into their lives.
All das hat die KI ohne mein weiteres Zutun geschrieben.
Für DAMANTIAN habe ich schnell mal ein paar Highlander/Vampir-Klischees zusammengerührt, als wäre es eine BBC-Serie über einen Unsterblichen, der einer Scotland Yard-Beamtin bei ihren Ermittlungen hilft. Hier habe ich genauer darauf geachtet, dass die KI das schreibt, was ich erzählen wollte.
Ein Ausschnitt:
"Ally, darling, can you spare a moment?" Damantian called out, his voice carrying over the murmur of the night. Inspector Ally West looked up from her notepad, the harsh light of the streetlamp casting shadows on her face as she scanned the perimeter of the crime scene. She spotted him leaning against the brick wall, his dark hair blending into the shadows of his all-black attire.
"Damantian," she replied, her voice a mix of surprise and wariness. "You’re out late tonight."
"Couldn’t sleep," he said with a shrug, pushing his black-rimmed glasses up his nose. "Thought I’d take a stroll."
The air had the scent of rain-soaked asphalt and the faint metallic tang of blood, a scent that made his stomach churn. He’d seen enough death to last an eternity, and yet here he was, drawn to it once again. The house behind the yellow tape was a stark contrast to the opulence of its neighbors, a silent sentinel of the darkness that could invade even the most well-guarded places.
Ally stepped out from under the blue-and-white canopy, her eyes scanning the street before landing on him. She nodded to the officers at the barricade, and they parted for her like a curtain, allowing her to join him. "What brings you here?" she asked, her tone guarded.
He gestured to the house with a tilt of his head. "The same thing that brings you, I suspect."
Her eyes narrowed. "This isn’t a tourist attraction."
"I know," he said, his gaze never leaving hers. "But I have a certain… expertise in these matters."
For a moment, she hesitated, her hand hovering over the walkie-talkie at her hip. Then, with a sigh, she waved him over. "Alright, but keep your nose out of things you don’t understand."
Damantian stepped through the tape, the plastic whispering against his clothes. He knew the rules of the mortal world, but rules had never stopped him before. His eyes swept over the scene, taking in every detail, his mind already racing with theories and connections to past atrocities. The house was a canvas of chaos, a silent scream in the otherwise orderly street.
"You can’t be here," she hissed as he approached the door.
He offered her a small, knowing smile. "But I am."
With a frustrated shake of her head, she led him into the hallway. The house was a labyrinth of old-world grandeur, the wallpaper peeling and the floorboards creaking under their feet. The air was thick with the scent of death, a scent that was all too familiar to Damantian. His heart quickened, the thrill of the hunt coursing through his veins like an electric current. He had been born for this, or so he liked to believe.
In the dimly lit room, the forensic team moved with meticulous precision, collecting evidence that would tell a story of pain and fear. Ally paused, watching them for a moment before turning to him. "What do you make of it?"
He studied the scene, his eyes lingering on the crimson smears on the wall. "It’s a message," he murmured. "A signature."
Her eyes searched his, looking for a clue to his uncanny intuition. "How do you know that?"
"I’ve seen it before," he said, his voice low. "Too many times."
The tension between them grew as thick as the shadows that clung to the corners of the room. Ally knew she should be questioning his presence, his knowledge, but she couldn’t ignore the pull she felt toward him, the way his eyes seemed to see straight through her. She took a deep breath and nodded. "Alright," she said. "But remember, you’re just an observer."
He smirked, a hint of mischief in his gaze. "For now."
Ally raised an eyebrow. "Found the murder weapon yet?"
"No," she said, her voice tight. "But we’re searching everywhere."
"Ah," he said, his eyes lighting up. "But have you checked the secret room behind the fireplace in the library?"
Her eyes narrowed. "The what?"
"The secret room," he repeated, his voice calm. "On the second floor. It’s quite cleverly hidden."
"How do you know about that?" she demanded, her hand resting on her holster.
He shrugged. "I’ve had a few… hobbies over the centuries. Architectural history is one of them."
Her eyes searched his, looking for a lie, but all she saw was the truth, stark and unyielding. "You lived here?"
"More than 200 years ago," he admitted with a humorless smile. "The rent was much more reasonable back then, though London was considerably smellier."
Ich lehne mich gerne mal aus dem Fenster: Wenn man so einem Generator das gesamte John Sinclair-Lexikon einspeist, kann man damit schneller und professioneller einen druckfähigen Roman abliefern, als es den aktuellen Autoren der Serie heute lieb sein dürfte.
Ein daraus heute schon resultierendes Problem ist die Überflutung des Buchmarktes mit weitgehend KI-kreierten Büchern. Wer sich noch an den Buchverlag erinnert, der massenweise alte Horrorromane illegal und leicht umgeschrieben neu auf den Markt warf – das wäre heute gar nicht mehr nötig. Billige Gruselschmöker "schreibt" die KI auf Zuruf, rechtlich einwandfrei.
Ich habe hier nur ein paar knappe Beispiele dessen vorgestellt, was die KI-Generatoren können. Es hakt immer noch an manchen Stellen, die "master language" bleibt vorerst englisch, und je länger man damit arbeitet, desto mehr fallen einem auch sich wiederholende Phrasen und inhaltliche Leerläufe auf, die auf dem begrenzten Trainingsmaterial beruhen.
Aber es ändert nichts daran, dass wie hier ein Monster wachsen sehen. Die KI wird – mit der Hilfe des Menschen oder ohne – zumindest die banaleren Arten von Literatur sehr bald so authentisch "schreiben" können, dass es selbst Experten schwerfallen wird, sie von echter menschlicher Kreativleistung zu unterscheiden.
Die Zukunft – sie wird weitgehend ohne uns auskommen:
Definitiv sehr interessant. Hast du die eingestreuten Grafiken mit Midjourney gemacht?
Ja.
Sprachlos 😶
Zum Thema "Bücher schreiben mit KI-Hilfe" habe ich mir letzthin mal sudowrite.com angesehen. Da legste dich echt nieder, sowohl im positiven (mein akiver Wortschatz im Englischen ist echt für die Tonne, und was das Teil an Drumherum, Optionen und Plugins anbietet kann sich sehen lassen) als auch im negativen Sinn (Klischee olé, wenn man nicht aktiv "dagegen arbeitet").
Deutsch kann das Ding auch, aber man merkt schon dass der Umfang der englischsprachigen Trainingsdaten um Einiges größer ist.
Wir brauchen John Connor. Jetzt!
Der große automatische Grammatisator ist da.
Ist da jemand Roald Dahl-Fan?
Wer nicht?
Gibt es vergleichbare Tools auch schon in deutscher Sprache?
Jein. Einige der Generatoren können deutsch verstehen und generieren, aber man merkt den Ergebnissen den Umweg über diverse Übersetzungen an. Das taugt (noch) nicht. Es mag aber Alternativen geben, die ich nicht kenne.
Ich habe den AI Story Generator gerade mal mit der Vorgabe A fantasy story set in the Discworld, in which the witch Tiffany meets Lord Vetinari" starten lassen und finde das Ergebnis schon erstaunlich gut. Die AI kennt die Scheibenwelt, sie kennt Haupteigenschaften der Charaktere, sie kennt relevante weitere Nebenfiguren. Der Schreibstil hat Ähnlichkeiten mit Pratchett und ist gut zu lesen. Mit etwas mehr Vorgaben und Steuerung kommt da solide Fan-Fiction raus.
Das gilt doppelt, wenn man die Ergebnisse Absatz für Absatz "führt".
Ja, Muster erkennen und Muster befolgen, kann die KI, aber die Größe dieser großen Künstlern liegt darin, eigene, sinnvolle und überraschend Muster zu entwickeln. Wahrscheinlich wäre eine weitere Arbeit von Pratchett überraschender gewesen.
Wenn ich nicht falsch liege, hast du den für Klaus generierten Text nicht gelesen – woher nimmst du dir das Recht, ihn zu beurteilen?
Weil der Mechanismus so funktioniert. Weil der Mechanismus funktioniert, wie er funktioniert, kann ich mir schwer vorstellen, dass es jemals anders sein wird, weil der Mechanismus mit Statistik arbeitet.
Wahrscheinlich wäre sie das. Aber trotzdem: Das, was mit minimaler Vorgabe jetzt schon rauskommt ist erstaunlich. Und vor zwei, drei Jahren hätten die meisten noch nicht für möglich gehalten, was jetzt ganz einfach geht.
Gibt nochmal zwei, drei Jahre dazu und der Nachfolger vom Nachfolger kann dann vielleicht schon Geschichten schreiben, die einem "echten Pratchett" wirklich nahe kommen.
Das ist lediglich das typische "Nur Menschen sind wahrhaft kreativ.".
Dass es so schwer fällt diese Entwicklung in die Zukunft zu extrapolieren ist wahrscheinlich dem Großteil der Menschen zu Eigen.
Große künstlerische Werke leben davon, Gewissheiten infrage zu stellen, die KI funktioniert nach statistischen Mustern, sie lebt praktisch nach Konstruktionsprinzip von Mustern und Gewissheiten. Gewissheiten können auch Spielregeln wie beim Schach oder Go sein.
Um Gottes Willen!!! O_O Sowas darfst du doch nicht ins Internet raushauen! Pen&Paper-Rollenspieler auf der ganzen Welt werden nie wieder ihr Haus verlassen und elendig vor dem Bildschirm verhungern! ÓnÒ
;D
Spaß beiseite, der Bildgenerator und die Möglicheit direkt danach mit der erzeugten Figur "hinter dem Bild" zu interagieren hat mich grade schon einige Stunden gekostet. Das is echt der Wahnsinn, was da inzwischen möglich ist. Nach einer Weile stellt man zwar fest das die Figuren alle nur sehr oberflächlich Charakterisiert werden, aber "Oberflächlich" ist in vielen fällen mehr als manche Filme oder Serien hinbekommen. Richtige Probleme hatte ich mit nicht-Menschlichen Figuren. Das hat alleine 40 minuten Prompt-Optimierung gebraucht, damit ich nicht mit einem Alten Hexer, sondern mit einem Drachen Rede, und das Feintunen zum Asiatischen Drachen waren nochmal Gottlose Stunden…
Aber alles in allem; Das ist schon extrem beeindruckend.
Die Beispiele in deinen beiden Artikeln hier sind ohne Frage beeindruckend. Aber sie beleuchten vor allem die Stärken der KI und das worauf sie trainiert wurde: Fortsetzung von Texten. Es gibt aber einiges, was meines Erachtens nach bis dato absolut nicht gut funktioniert, für gute Geschichten aber notwendig ist.
Habe einige Monate lang daran gebastelt, einen KI-Bot zu erstellen, der die Spielleiter-Rolle im Pen&Paper übernehmen soll (also sehr ähnlich zu den Text-Adventures, mit denen du im anderen Artikeln experimentiert hast). Irgendwann habe ich es aufgegeben. Der KI (zumindest denen, die ich getestet habe) fehlt das Verständnis für Perspektive, wer bin ich, wer bist du? Wer hat was erlebt? Wer weiß was? Es gibt kein Verständnis für den Umgang mit Information, keines für Pacing. Hintergrundinformationen werden ständig zum frühestmöglichen Zeitpunkt in den Text gespammt. Logisch, die KI ist darauf trainiert, Texte basierend auf den vorhandenen Informationen zu schreiben – nicht darauf, sie NICHT zu erwähnen. Es gibt kein logisches und kohärentes Verständnis für Raum, für Sicht, für Hörweite. Eine Figur wandert alleine den Strand entlang und spricht dann doch wieder mit den anderen. Eine andere schaut aufs Meer heraus und sieht direkt das versunkene Wrack in mehreren Kilometern Entfernung, weil die KI weiß, dass das dort liegt. Oder das Haus am anderen Ende der Insel obwohl ein Berg dazwischen steht.
Bei Storyentwicklung kam noch hinzu: die KI ist sehr schlecht darin, Anschlüsse an zukünftige Szenen zu schreiben, Informationen nicht vorwegzunehmen, die in einer bereits auf Szenen heruntergebrochenen Geschichte für später geplant sind.
Je länger man solche Experimente laufen lässt, desto stärker fahren sie sich fest, drehen sich im Kreis, de-railen oder die Figuren degenerieren.
Und ich will gar nicht mit den unsäglichen Limitierungen von "unangemessener" Sprache und Inhalt anfangen, mit denen die wirklich guten Modelle kastriert sind. Das ist nochmal ein Thema für sich glaube ich.
Bitte nicht als "AI kann keinen Mensch ersetzen!" verstehen. Natürlich wird sie das können. Habe aber ein bisschen das Gefühl, dass wir im Moment sehr viel mit Basismodellen arbeiten, die auf sowas absolut nicht trainiert sind.
Das ist alles richtig. Ich habe das in meinem Text auch mehrfach angesprochen. Die "Vergesslichkeit" von der KI ist mir auch übel aufgefallen. Du steigst mit einer Person aus einem Auto und gehst ein paar Schritt, da greift die Person auf einmal laut KI ins Handschuhfach. Aber in diesem Artikel ging es um die Fortschritte der KI, nicht um ihre Defizite. Um meinen letzten Absatz aufzugreifen: das Monster wächst – es ist noch lange nicht erwachsen.
Ich denke, das Problem geht über reines Training hinaus. KI-Modelle, die Protagonisten ("wer weiß was") oder die Welt ("was erlaubt mir die Physik zu sehen") usw. einigermaßen korrekt abbilden, fallen nicht vom Himmel. Die Evolution hat etliche Millionen Jahre daran geschraubt, Gehirne zustande zu bringen, die von Geburt an Strukturen aufweisen, die das können. Das lernt ein neuer Mensch nicht von Grund auf in ein paar Jahren, jedenfalls nicht ausgehend von einem Haufen ungeordneter Neuronen.
Dass eine KI das lernen kann, einfach indem man sie lange genug an irgendwas trainiert, das nur Text und weder Physik noch andere Menschen beinhaltet, halte ich nach wie vor für hochgradig utopisch, wenn nicht überheblich seitens der KI-Programmierer.
Maschinenlesbare Konzepte der Welt gibt es. Nennt sich "Ontologie", und Firmen wie Cylex bieten sowas seit Jahrzehnten als Datenstruktur an (und stecken Manpower rein, das Ding auf dem aktuellen Stand zu halten). Nur fehlt es halt an Trainingsdaten, anhand derer die KI ihren Input auf die Ontologie mappen lernen kann und umgekehrt.
Die Erkenntnis, dass ein Schwert im Rollenspiel, das +2 Schaden an seinem Adressaten anrichtet, irgendwie für ein anderes Konzept steht als das Schwert, das ein Archäologe gestern in China ausgebuddelt hat, oder dass der Protagonist die Infos nicht jetzt schon ausplaudern darf, die er morgen erst bekommt, die fällt nicht vom Himmel. Dazu braucht es positives *und* negatives Feedback.
Überhaupt ist Zeit ein Konzept, das eine KI nicht von selber lernt. Die Tesla-Leute mit ihrem Autopiloten haben ein halbes Jahrzehnt lang versucht, nur mit Trainingsdaten hinzubekommen, dass die KI begreift: der Radfahrer, der hinter dem Auto verschwindet, wird demnächst (höchstwahrscheinlich) auf der anderen Seite wieder auftauchen. Ging nicht. Die nötigen Strukturen dafür musste jemand von Hand einbauen. Erst dann hat das Training den Rest erledigen können.
Mir scheint hier dieser Absatz relevant:
Das ist richtig, aber eben nur die halbe Wahrheit. Ich bin absolut überzeugt davon, dass die KI noch mit anderen Techniken kombinierbar sein wird, die dem sturen Datentraining Kontext geben. Dann wird es sehr schnell gehen.
Kombinierbar ist es jetzt schon. Jedenfalls so prinzipiell. Macht nur keiner, weil die LLM-Protagonisten sich in ihre LLM-kann-das-mit-genug-Daten-und-Training-Sackgasse verrannt haben und ihr Geld lieber für weitere 10000 nvidia-GPUs ausgeben als mal konzeptionell nachzudenken.
Damit es da zu einem Umdenken kommt, wird erstmal mindestens einer der aktuellen Protagonisten sein Venture Capital aufgebraucht haben und spektakulär pleite gehen müssen.
Zum Kontext-Geben braucht’s halt Trainingsdaten. Tesla macht es sich einfach und guckt ein paar Millionen Leuten schlicht beim Autofahren über die Schulter. Den Neurochip, der dasselbe beim Kategorisieren des Inputs eines Menschen macht, gibt’s nicht, insofern muss da jemand entweder massiv Hand und Hirn anlegen (mega Aufwand, Cylex hat da Jahrhunderte an Manpower reingesteckt) oder das Ganze irgendwie bootstrappen.
Wie dieses "irgendwie" gehen soll? keine Ahnung. Wäre ich an einer Uni auch nur im Entferntesten mit dem Feld beschäftigt (oder bei Cylex angestellt), ich würde mich draufstürzen …
"Zum Kontext-Geben braucht’s halt Trainingsdaten." – davon spreche ich nicht. Was es braucht, ist eine Art Handbuch der realen Welt, die der KI jenseits von reinen Daten auch den Kontext und die Zusammenhänge beibringt. Eine KI, die bei der Angabe "blaue Sonne" weiß, dass es so etwas eigentlich nicht gibt, im Idealfall aber eine Lösung findet, es zu erklären.
Das Handbuch gibt bzw. gäbe es schon. Das ist u.A. die Ontologie, die Cycorp (nicht Cylex, mein Konfusionsfehler) seit Jahrzehnten verkauft und weiterpflegt.
Nur: die KI arbeitet "nach außen" ja nicht mit Prädikatslogik über Beziehungen innerhalb dieser Ontologie, sondern mit Text oder Fotos/Videos. Die müssen in besagte Relationen hin- und wieder zurückübersetzt werden, und das geht (nach heutigem Wissensstand) nur anhand von mehr oder weniger vielen Beispielen — die es aktuell schlicht nicht gibt.
Aktuelle KIs basteln sich beim Training ihre Ontologie selber, teilweise sogar sprachübergreifend — aber halt grob unvollständig und nur mit einem Riesenberg Trainingsdaten. Mit a-priori-Ontologie untendrunter dürfte der benötigte Berg kleiner sein. Aber wieviel kleiner? das weiß halt noch niemand.
Cycorp selber daddelt da auch mit, siehe https://cyc.com/, aber das ist halt eine vergleichsweise alte Firma mit etablierten Produkten. Da kommt (anscheinend) keiner auf die Idee "hey, lass uns eine coole Demo schreiben und ein Startup ausgründen, wir zeigen den Jungs von OpenAI usw. wo der Hase langläuft".
Ich gehe nicht mit allem, was du über Fähigkeiten und Unfähigkeiten aktueller KI schreibst konform, aber das hier:
"Macht nur keiner, weil die LLM-Protagonisten sich in ihre LLM-kann-das-mit-genug-Daten-und-Training-Sackgasse verrannt haben und ihr Geld lieber für weitere 10000 nvidia-GPUs ausgeben"
ist genau der springende Punkt, den ich beobachte. Kaum jemand baut noch wirklich "intelligente" Lösungen, sondern es wird mit LLM-Kanonen auf Spatzen geschossen. LLMs verursachen für die meisten Aufgaben einen so unfassbaren Overhead an Rechenaufwand, weil sie nebenbei noch bei jeder Anfrage die Wahrscheinlichkeiten für lyrische Ausdrücke, direkte Rede, putzige Synonyme, tausende andere Dinge und das in hundert Sprachen berechnen. Und wenn man an einen Punkt gerät, an denen LLMs straucheln (Stichwort Weltmodelle, zeitliche Kohärenz, etc.), dann heißt die Lösung aktuell meist: noch mehr LLMs und dann reden die eben miteinander. In menschlicher Sprache natürlich. Das ist teils schon echt wild.
Das macht Entwicklung und Betrieb nicht nur teuer, sondern auch langsam.
Gehe ich voll und ganz mit. Und da 10000 GPUs und viel Rechenoverhead unfassbar viel Energie kostet, stehe ich dem aktuellen Weg einfach mal sehr sehr skeptisch gegenüber, unabhängig davon, wie beeindruckend oder nicht beeindruckend das Ergebnis am Ende sein mag.
Es fehlt einfach inzwischen der Wille des Selbstdenkens. Ob es der Programmieranfänger ist, der meint die LLM würde seinen Code schreiben können (was sie von simplen Allerwelts-Sachen abgesehen eben meist nicht korrekt tut) bis hin zu irgendwelchen Großprojekten, die meinen, plötzlich seien alle Probleme mit KI lösbar. Aber niemand ist in der Lage, den korrekten Input zu prüfen und auch nicht die Plausibilität des Outputs, und nich weniger, auf welcher Basis sie entstanden. Man verlässt sich mehr und mehr auf diesen Mist, aber von Logik ist das meiste leider sehr weit Weg, weil LLM eben bei noch so viel Energieverschwendung schlicht nicht logisch "denken" können.
Für mich, nette Spielzeuge, die aber ein ökologisches Disaster zur denkbar günstigsten Zeit des Klimawandels anrichten, ohne verlässliche Hilfe für irgendwelche Sachen bieten zu können.
Und für ein paar tolle generierte Romane oder Drehbücher, die vielleicht irgendwann wirklich gut sein mögen, bin ich eigentlich nicht Willens, mein Klima aufs Spiel zu setzen. Ich sehe einfach bislang den wirklichen Nutzen nach wie vor nicht. Bei nicht einem einzigen Projekt. Nichts davon bringt die Welt in irgendeiner Art voran (auch wenn viele das mit jeweils speziellem Fokus behaupten, ohne es nachgewiesen zu haben!), aber garantiert machen alle die Welt kaputt und nVidia reich.
Jau. Definitiv.
Ich habe das mit dem Code-Generieren letzthin mal ausprobiert, nachdem sämtliche Suchmaschinen auf meine Fragen hin inzwischen auf irgendwas totoptimierten Schwachsinn ausspucken, aber die Hälfte meiner Keywords ignorieren.
ChatGPT hingegen lieferte auf Anhieb Code, der so aussieht, als würde er funktionieren — was mir zwar erstmal sehr weitergeholfen hat. Aber: die Anpassung an Python >3.5 (steinalt; aktuell ist 3.13) durfte ich genauso selbermachen wie diverse in der Frage implizierte Sonderfälle sowie einen offensichtlichen und einen eher versteckten Speicher-vollgemüllt-Sonderfall aus der Kategorie "die KI denkt nicht, also hat sie nicht mitgedacht".
Naja. Zurück zum Suchproblem. Das ist definitiv ein lokales Pessimum, jedenfalls aus Sicht des Produkts (vulgo "Suchmaschinenbenutzer" genannt), das sich zumindest in meinem Fall nicht daran gewöhnen will, dass die Google/Bing/whatever-Suche früher weitaus brauchbarere Antworten geliefert hat.
Wenn die Suchmaschinen ihre KIs wenigstens dazu verwenden würden, all diese unsäglichen KI-generierte Datenergußseiten aus dem Index zu werfen … aber nein. Wozu? diese Klicks ins Nirvana gehen auf Seiten mit Anzeigen, die der KI-Müll-Content-Spammer von Google kauft, und bringen denen dadurch noch mehr Bares.
Ich bin vor Monaten zur Suchmaschine Kagi gewechselt, zahle für diesen Service $10/Monat anstatt mit Anzeigen und tiefergehendem Tracking und habe die besten Suchergebnisse seit Jahren. Diese $10 amortisieren sich so schnell, wenn man die gesparte Arbeitszeit einrechnet, die ich sonst auf Google und Co. mit sinnlosen SEO-Treffern verschwende.
Kagi nutze ich auch. Aber für Spezialitäten wie den angesprochenen Fall ist sie leider noch(?) nicht wirklich besser als der Anzeigenverein.
…Ned Ludd hatte doch recht. 🙂
Grundsätzlich: ich glaube nicht, dass wir je an den Punkt kommen, an dem man nur auf den Knopf drückt, und dann produziert die Maschine einen echt guten Roman. Das ist die selbe Fehlleistung wie die von Menschen, die in den 90ern stolz auf ihre verschwitzten Gitarrenhelden gezeigt haben und meinten, elektronische Musik sei gar keine Musik. Da müsse man ja nur, genau, auf einen Knopf drücken und dann käme der fertige Song raus. Genau wie heute digitale Instrumente Teil jeder Studioausrüstung sind, wird KI bei der Erschaffung von Unterhaltungs-Content relativ bald vermutlich nur ein Werkzeug unter vielen sein, vorausgesetzt, die berechtigten ethischen und ökologischen Vorbehalte lassen sich aus dem Weg räumen.
Davon abgesehen frage ich mich mittlerweile aber auch: was ist eigentlich der Sinn hinter der Idee, eine KI mehr oder weniger im Alleingang fiktionale Texte schreiben zu lassen? Wie soll das monetarisiert werden? Die Maschine schreibt auch im Idealfall nicht besser als ein halbwegs fähiger Autor, um einen Gewinn an Qualität kann es also nicht gehen. Sie schreibt natürlich günstiger (wenn wir mal die nötige Manpower ausklammern, die das anschließende Lektorat kostet), aber die Honorare für Heftchen-Schund, Hörspiel-Skripte und Ähnliches pulpig-serieller Natur sind doch eh ein Witz. Spart es denn irgendwas Substanzielles, stattdessen eine KI dranzusetzen? Geht es dann darum, on the fly möglichst individuell auf einen Kunden zugeschnittene Inhalte zu produzieren? Ich glaube nicht, dass das auf Dauer funktioniert, weil man sich dann am nächsten Tag im Büro mit niemandem darüber unterhalten könnte. Das wäre dann keine Kultur mehr, sondern hätte eher was von Bedürfnisbefriedigung. Oder soll möglichst viel Content in möglichst kurzer Zeit produziert werden? Wer soll das denn alles lesen/gucken? Die Menschheit produziert doch bereits jetzt pro Jahr mehr Kultur, als man in einem ganzen Menschenleben konsumieren kann.
Als Experiment ganze Romane zu generieren, finde ich durchaus spannend. Hinsichtlich einer praktischen Anwendbarkeit von KI in der Textproduktion, die über die des erwähnten einen Werkzeugs unter vielen hinausgeht, habe ich Zweifel.
In meinem Browser befindet sich eine KI (Opera, Aria Browser KI). Ich habe ein bisschen mit ihr gespielt:
"Schreibe die eröffnungszene eines Films, in der zwei Katzen-Astronauten, Becky und Rufus, in einer Raumkapsel zum Mars fliegen. Eahrenfz das Abbrems-Manövers fällt ein Triebwerk aus. Die Szene endet mit einem Cliffhänger. Im Stil von Torsten Dewi. Erfinde einen Filmtitel dazu."
Ergebnis:
Filmtitel: „Katzen der Galaxie: Mission Mars“
Eröffnungszene: Der Flug ins Ungewisse
Ort: Innerhalb der Raumkapsel „Sternenpfote“, die mit futuristischen Katzen-Designs ausgestattet ist.
Zeit: Frühmorgens, der Blick aus dem Fenster zeigt die Erde in der Ferne.
Die Kamera zoomt auf zwei Katzen-Astronauten: Becky, eine elegante Siamkatze mit einem schimmernden Raumanzug, und Rufus, ein muskulöser Maine Coon mit einem selbstbewussten Ausdruck. Beide sitzen in ihren Sitzen und beobachten die Displays.
Becky: (mit funkelnden Augen) „Rufus, schau dir die Erde an! So weit weg und doch so vertraut!“
Rufus: (grinst) „Und bald werden wir die ersten Katzen auf dem Mars sein! Bereit für das Abenteuer?“
Ein Alarmton ertönt plötzlich, und die Bildschirme blitzen auf. Becky schaut nervös auf die Anzeigen.
Becky: (angespannt) „Das sieht nicht gut aus! Wir haben ein Problem mit dem Triebwerk!“
Rufus: (blickt auf die Kontrollanzeigen) „Welches Triebwerk?“
Becky: (mit besorgtem Blick) „Das sekundäre Triebwerk! Es zeigt Überhitzung! Wir müssen das Abbremsmanöver sofort einleiten!“
Die Kapsel beginnt zu vibrieren, während die beiden Katzen hastig die Systeme überprüfen. Rufus drückt hektisch Knöpfe.
Rufus: „Ich aktiviere das Haupttriebwerk! Halten wir uns fest!“
Becky: (mit entschlossener Stimme) „Wir müssen es schaffen!“
Mit einem lauten Krachen gibt es eine Erschütterung, und die Kapsel wird von einem heftigen Ruck durchgeschüttelt. Die Anzeigen blitzen warnend rot auf.
Rufus: (panisch) „Das sekundäre Triebwerk ist ausgefallen! Wir können nicht genug abbremsen!“
Becky: (verzweifelt) „Wir verlieren die Kontrolle! Rufus, ich kann das Haupttriebwerk nicht stabilisieren!“
Die Kapsel taumelt unkontrolliert, und alles um sie herum wird chaotisch.
Rufus: (schreiend) „Becky, wir müssen einen Plan B finden!“
Becky: (mit zitternder Stimme) „Ich… ich kann es nicht aufgeben!“
Plötzlich explodiert ein Teil der Kapsel, und die Lichter flackern. Die Kamera zoomt auf Be. ckys und Rufus' angespannte Gesichter.
Becky: (schreiend) „Halt dich fest, Rufus!“
Die letzte Einstellung zeigt die Kapsel, die unkontrolliert in die Atmosphäre des Mars stürzt, während die Bildschirme schwarz werden.
Text auf dem Bildschirm: „Fortsetzung folgt…“
Kann man nicht meckern.
Meckern kann man immer. Ich finde es zu sehr Standard.
Vielleicht kann KI ein gutes Werkzeug werden, aber das heißt nicht, dass es weniger Aufwand bedeutet, und es heißt nicht, dass es weniger Kreavität von den Machern bedeutet, denn es kommt auf die kreativen Prompts an.
Nebenbei kommt es immer auf die interessanten Fragen an. Die Arbeit ist es, auf die interessanten Fragen zu kommen.
"Vielleicht kann KI ein gutes Werkzeug werden, aber das heißt nicht, dass es weniger Aufwand bedeutet, und es heißt nicht, dass es weniger Kreavität von den Machern bedeutet" – das ist ja nun mittlerweile vollumfänglich widerlegt. Wenn ich ein Bild von einem Wiener Schnitzel brauche, ist es sehr wohl erheblich weniger Aufwand, bei MidJourney "Bild von einem Wiener Schnitzel" einzugeben, als ein Schnitzel zu braten und es zu fotografieren. Dass Prompts eine gewisse Kreativität und Einfühlung in die entsprechende KI-Struktur verlangen, ist eine Binsenweisheit.
Wer braucht ein Bild von einem Wiener Schnitzel?
Für einen Blog mag es ausreichen. Wahrscheinlich werden auch weniger Stockfotos gebraucht. Waren Stockfotos wirklich so teuer?
Für ein Kochbuch in einem renommierten Verlag wird man sich die Mühe machen, einen Fotografen zu engagieren und das gebratene Schnitzel ablichten zu lassen, weil es da auch um Stil und Handschrift geht.
Bei Katalogtexten dürfte KI eine wunderbare Erfindung sein. Ich glaube, die Arbeit hat wohl niemand gern gemacht.
"Für ein Kochbuch in einem renommierten Verlag wird man sich die Mühe machen, einen Fotografen zu engagieren und das gebratene Schnitzel ablichten zu lassen" – auch das ist schon längst nicht mehr wahr.
Wenn das so wäre, wäre es ein Verlust.
Ich kann mir nicht vorstellen, dass es usos ist, auf den Aufwand zu verzichten.
Bei den renommierten Verlagen finde ich nur eine Ausgabe von Lisa aus dem Burdaverlag, in der es KI-generierte Pastagerichte gibt, wahrscheinlich auch mit Bildern aus KI.
Andere Büchern geben schon im Titel offen zu, dass sie mit KI-Rezepten arbeiten.
Es werden aktuell sehr viele Kochbücher mit KI bestückt, es wird nur nicht bekannt. Ich bin aus der Branche, da kenne ich mich aus. Den Verlagen dieser Werke geht es generell nicht gut, die reduzieren Kosten, wo es eben geht. Und die größten Kosten bei Kochbüchern kommen von den Fotos.
Wahrscheinlich, weil man die meisten Rezepte gratis im Netz bekommen kann.
Traurig ist es schon, denn mit individuellen Fotos kann man sich von der Masse abgrenzen.
Wahrscheinlich blättere ich zu wenig in aktuellen Kochbüchern. Ich habe einen Blog gefunden, bei dem gezeigt wurde, wie solche Bilder aussehen können, schon edel, durchaus realistisch, aber auch steril.
Wie viel Exemplare werden von einem gewöhnlichen Kochbuch verkauft? Wie viele Bücher bringt so ein Kochbuchverlag heraus?
Diese Fragen lassen sich so wenig beantworten wie die Frage, wie viele Autos von einem Modell verkauft werden und wie viel Profit der Hersteller macht. Ein Porsche ist kein Fiat 500. Generell lässt sich allenfalls sagen, dass der Großteil der Kochbücher mittlerweile keine fünfstelligen, sondern eher niedrige vierstellige Verkaufszahlen generiert.
Dass es immer Ausreißer gibt, das ist klar.
Wenn die Auflage der Kochbücher in der Regel um Faktor 4 oder 5 gesunken ist, dann sagt es schon was aus.
Das hat allerdings null mit KI zu tun.