Mein KI-Assistent: Doof, aber willig
Themen: Künstliche Intelligenz |Am 25. und 26.1. finden wieder die FANTASY FILMFEST WHITE NIGHTS statt.
Zwei Tage mit zehn Filmen (plus eine Sondervorstellung vorab). Das erzeugt nicht nur Vorfreude, sondern auch Arbeit, denn traditionell stelle ich die Reviews schon im Vorfeld zusammen und lasse nur den "Kritik/Fazit"-Teil leer, um nach den Screenings meinen Eindruck schnell online stellen zu können.
Diese Vorab-Formatierung der Reviews ist ein echter Schlauch, ganz besonders beim großen Festival im Herbst. Über 30 Beiträge, alle mit zwei Bildern (Poster und Screenshot), Trailer, alles nach exakten Vorgaben formatiert. Da geht ein ganzer Nachmittag dumpf dran verloren.
Über die Jahre ist es mir gelungen, den Ablauf ein wenig komfortabler zu gestalten, in dem ich z.B. ein leeres Template mit dem Duplizierungs-Plugin von WordPress dutzendfach kopiere und dann anpasse. Aber es bleibt größtenteils Handarbeit.
In diesem Jahr kam ich auf die Idee, mir mal von der KI unter die Arme greifen zu lassen. Dabei ist es sehr praktisch, dass ich ein Jahresabo für perplexity.ai von der Telekom geschenkt bekommen habe.
Zuerst versuche ich relativ erfolglos, der KI beizubringen, wie sie einen Rohtext formatieren soll, damit er in meine Vorlagen passt. Vorgestern gebe ich mich nochmal ran und probiere es anders: Ich kopiere die Infos und Texte von der Festival-Webseite direkt ein und erkläre perplexity recht holperig, wie ich mir die Anpassungen vorstelle:
Ich möchte, dass du einen Text bearbeitest, und zwar nach folgendem Muster: Der erste Absatz kommt an den Schluss, der zweite Absatz wird gelöscht, das Wort regie wird großgeschrieben und fett gesetzt, das Wort darsteller wird ebenfalls großgeschrieben und fett gesetzt. Das allein stehende Wort film wird gelöscht und der Inhalt der ersten Klammer im Text wird vor das Wort Regie gesetzt, gefolgt von einem Punkt und einem Leerzeichen. Hinter das Wort "Regie: " kommt der Name aus der folgenden Zeile, hinter das Wort "Darsteller: " die darauf folgende Liste. Das Wort film und die darunter liegende Zeile werden gelöscht. Alles klar?
Zu meiner Überraschung wirft perplexity daraufhin den gesamten Textblock fast exakt so aus, wie ich ihn brauche. Ich gönne mir eine weitere Stunde, die Details zu präzisieren. Dann bitte ich die KI, mir einen etwas strukturierteren Prompt für das gleiche Ergebnis zu generieren. Das tut sie auch:
Bearbeite den folgenden Text nach diesem Muster:
1. Speichere den ersten Absatz zwischen und lösche ihn.
2. Lösche den zweiten Absatz komplett.
3. Ändere das Wort "regie" zu "REGIE" (fett geschrieben).
4. Ändere das Wort "darsteller" zu "DARSTELLER" (fett geschrieben).
5. Lösche das alleinstehende Wort "film" und das Wort „webseite“, wenn es vorhanden ist.
6. Setze den Inhalt in der Zeile vor der der ersten Klammer an den Anfang des Texts (großgeschrieben), danach den Inhalt der Klammer in die nächste Zeile. Lösche die leere Klammer.
7. Füge nach "REGIE: " den Namen aus der folgenden Zeile ein.
8. Füge nach "DARSTELLER: " die darauf folgende Liste ein.
9. Füge am Ende „OFFIZIELLE SYNOPSIS:“ und „KRITIK:“ und „FAZIT:“ dazu (fett geschrieben), jeweils durch einen Absatz getrennt. Füge den gespeicherten Absatz direkt hinter „OFFIZIELLE SYNOPSIS: “ ein, ohne Absatz. Wenn sich in dem Absatz Klammern befinden, kannst du sie samt Inhalt löschen.
10. Stelle das Ergebnis in HTML dar.
Bitte wende diese Änderungen auf den folgenden Text an:
[Fügen Sie hier den zu bearbeitenden Text ein]
Das ist hart an der Perfektion und erspart schon mal viel copy & paste und ständiges händisches umformatieren.
Aber da muss doch mehr gehen?
Ich frage perplexity, ob es sich die Texte nicht direkt von der Festival-Webseite ziehen könne. Die KI verneinte das, bei einem Test funktionierte es aber dennoch. Leider stellte sich das als wackelige Angelegenheit heraus: bei den meisten Seiten meldet die KI, sie fände keinen zu kopierenden Inhalt.
Am Ende des Reviews platziere ich ja immer einen Trailer zum Film. Auch da denke ich, die KI könnte das automatisieren, in dem ich die Zeile hinzufüge:
Suche zum Filmtitel den Trailer bei YouTube und setze die URL ans Ende des Textes
Das funktioniert leider auch nicht – zwar baut perplexity brav einen YT-Link ein, aber dieser führt grundsätzlich ins Leere.
So brauchen die Vorlagen immer noch ein gewisses Maß an händischer Nacharbeit, aber deutlich weniger als vorher. Zusätzlich vereinfacht habe ich mir den Vorgang, in dem ich den gesamten Prompt in Alfred als Snippet abgespeichert habe. Nun muss ich in perplexity nur noch xx und fff eintippen, um ihn aufzurufen.
Insgesamt bin ich schon mal sehr zufrieden – die elf Vorlagen für die White Nights-Reviews konnte ich locker in der halben Zeit stemmen. Und je häufiger ich perplexity für diese Aufgabe einsetze, desto mehr amortisiert sich auch die Entwicklungszeit. Das ist eine win/win-Situation.
Es wird auch sicher nicht die letzte Situation gewesen sein, in der ich mir einen eigenen KI-Knecht zur Arbeitsentlastung programmiere.
Sollte sich unter meinen Lesern ein KI-Experte befinden, der in der Lage ist, meine beiden Probleme zu lösen (Übernahme der Texte automatisch von der Webseite und selbsttätige Einbindung des Trailers), dann bin ich für jeden Hinweis dankbar.
The Problem is: Who are you? I don’t believe you.
Allgemeiner Tipp:
Gib der KI ein Beispiel (one-shot learning), z. B. einfach von letztem Jahr. Die LLMs sind verdammt gut darin, so ein Muster aufzunehmen und du kannst dir solch aufwändige Kommandos sparen.
Bei deinen Problemen kann ich leider nicht helfen. Vermutlich würde ich händisch Crawler schreiben und dafür fünfmal so viel Zeit aufwenden als die Texte händisch zu kopieren. Und im Jahr darauf ginge dann der Crawler nicht mehr ^^
Amateurhaft ins Blaue überlegt: die Texte werden an Speicherorten nach dem immer gleichen Muster abgelegt sein, du bräuchtest also nur ein Mal eine konkrete Adresse. Wenn die KI bei der Eingabe der URL aber nichts findet: ist es dann möglich, dass die Filminfos zwar unter dieser URL abrufbar sind, der eigentliche Text aber nicht Teil der Seite ist, die du da aufrufst, sondern separat in ein Template geladen wird und die KI das nicht kapiert? Da hilft eventuell, sich mal den Quelltext anzusehen.
Das habe ich auch gedacht, aber kurioserweise geht es bei einigen der Seiten, obwohl sie exakt so aufgebaut sind. Der Fehler ist nicht beliebig replizierbar, das macht es schwierig. Auch die Frage, warum die KI einen YT-Link extrahieren kann, dieser aber unbrauchbar ist, lässt sich vorerst nicht erklären.
Hast du denn man den von der KI extrahierten Link und den von Hand kopierten verglichen?
Versuch mal das hier in ChatGPT:
Bearbeite den folgenden Text nach diesem Muster:
1. Speichere den ersten Absatz zwischen und lösche ihn.
2. Lösche den zweiten Absatz komplett.
3. Ändere das Wort "regie" zu "REGIE" (fett geschrieben).
4. Ändere das Wort "darsteller" zu "DARSTELLER" (fett geschrieben).
5. Lösche das alleinstehende Wort "film" und das Wort „webseite“, wenn es vorhanden ist.
6. Setze den Inhalt in der Zeile vor der der ersten Klammer an den Anfang des Texts (großgeschrieben), danach den Inhalt der Klammer in die nächste Zeile. Lösche die leere Klammer.
7. Füge nach "REGIE: " den Namen aus der folgenden Zeile ein.
8. Füge nach "DARSTELLER: " die darauf folgende Liste ein.
9. Füge darunter „OFFIZIELLE SYNOPSIS:“ und direkt dahinter den Text ein, der im HTML-Code der untenstehenden Seite mit "style="font-weight: 400;" ausgezeichnet ist.
10. Wenn es weitere Texte auf dieser Seite gibt, die im HTML-Code der untenstehenden Seite mit "style="font-weight: 400;" ausgezeichnet sind, füge sie darunter hinzu, mit einem Absatz getrennt.
11. Füge dahinter „KRITIK:“ und „FAZIT:“ dazu (fett geschrieben), jeweils durch einen Absatz getrennt. Füge den gespeicherten Absatz direkt hinter „OFFIZIELLE SYNOPSIS: “ ein, ohne Absatz. Wenn sich in dem Absatz Klammern befinden, kannst du sie samt Inhalt löschen.
12. Suche zum Filmtitel den Trailer bei YouTube und setze die URL ans Ende des Textes
13. Stelle das Ergebnis in HTML dar.
Bitte wende diese Änderungen auf den folgenden Text an:
https://fantasyfilmfest.com/above-the-knee/
Schon eine deutliche Verbesserung, aber immer noch wackelig – wenn du dieses Template auf THE SURFER oder PRESENCE anwendest, extrahiert die KI eine gar nicht angezeigte Kurzbeschreibung statt der Synopsis. Gilt für ChatGPT wie auch für Perplexity, scheint also eher am Code der Webseite zu liegen. Dabei ist die Aufgabe ja gar nicht so schwer: Den ersten großen Textkasten extrahieren.
Vielleicht klappt es die Texte von https://f3a.net/fantasyfilmfestwhitenights2025.html zu extrahieren. Die Website erscheint mir sauberer programmiert.
Mein ChatGTP-Prompt:
Todo: