Wichtigste Erkenntnisse
- Strukturierte Prompts übertreffen offene Anfragen bei Belletristik. Ein 5-teiliger Szenen-Prompt (Genre + POV + Sinnes-Anker + emotionaler Beat + Wort-Obergrenze) erzeugt Zeigen-statt-Erzählen-Prosa; „schreib eine Szene" erzeugt Handlungszusammenfassung. Die Vorlage ist die Technik.
- Der Widerspruchs-Prompt ist die zuverlässigste Charakterentwicklungs-Struktur. Dem Modell ein dominantes Merkmal und ein widersprechendes Verhalten geben; es eine Szene schreiben lassen, die beides zeigt, ohne beides zu benennen. Ergibt vielschichtige Charaktere, die der Leser erschließen muss.
- Dialog-Qualität verdoppelt sich, wenn man den Subtext vor den gesprochenen Zeilen festlegt. Dem Modell zuerst sagen, was der Charakter möchte, aber nicht sagt. Die gesprochenen Wörter umgehen dann diese versteckte Botschaft natürlich.
- Wort-Obergrenzen verhindern Aufblähung. Eine 200-Wort-Obergrenze bei einem Szenen-Prompt erzwingt Kompression; das Modell muss präzise sein. In 100-Wort-Schritten erhöhen wenn mehr benötigt wird, aber immer eine Obergrenze setzen.
- Überarbeitungs-Prompts brauchen ein benanntes Problem. „Überarbeite das" erzeugt minimale Änderung. „Überarbeite: eliminiere alle Passiv-Konstruktionen, jeder Satz muss mit einem konkreten Substantiv oder einem starken Verb beginnen" erzeugt messbare Verbesserung.
- Redaktionelle Vorlagen arbeiten auf Manuskript-Ebene. Plot-Konsistenz-Check, Pacing-Analyse und Exposition-Smoothing funktionieren auf abgeschlossenen Szenen und Kapiteln — nach dem Entwurf ausführen, nicht währenddessen.
- Größere Modelle halten Einschränkungs-Treue über lange Completions besser aufrecht. Llama 3.3 70B und Qwen3 32B folgen 5-teiligen Szenen-Einschränkungen zuverlässig; kleinere Modelle driften nach ~200 Token.
- Das Frontend ist weniger wichtig als das Modell und der Prompt. Ollama, LM Studio, SillyTavern und Agnai leiten den Prompt wörtlich weiter — der Belletristik-Qualitätsunterschied liegt in Modell + Prompt, nicht im Frontend.
Kurzfakten
- Vorlagen abgedeckt: 15 gesamt — Szenen-Schreiben (2), Charakterentwicklung (3), Dialog (2), Weltenbau (2), Stiltransfer (2), Überarbeitung (1), redaktionell (3).
- Getestet auf: Llama 3.3 70B, Qwen3 32B, Mistral Large — alle über Ollama auf Apple M5 Max 64 GB und NVIDIA RTX 4090 24 GB.
- Wort-Obergrenzen: 150–400 Wörter für Szenen; 100–200 Wörter für Dialog; 300–600 Wörter für Weltenbau-Passagen.
- Bestes Allround-Modell für Belletristik: Llama 3.3 70B (starkes Anweisungsfolgen, narrative Kohärenz, langer Kontext).
- Bestes für Stiltransfer: Mistral Large (konsistentes Prosa-Register; reproduziert Autoren-Stimmmuster zuverlässig).
- Bestes für Dialog: Command R+ 104B oder Hermes 3 (Charakterstimm-Differenzierung; naturalistisches Sprachregister).
- System-Prompt: Genre und POV in einer System-Message, nicht im User-Turn, setzen — es verankert jede Completion in der Session.
Warum strukturierte Prompts bei Belletristik wichtig sind
Der Standard-Fehler lokaler LLMs bei Belletristik ist Zusammenfassung: Das Modell erzählt, was passiert ist, statt die Szene zu zeigen. Das passiert, weil Instruction-tuned-Modelle für Task-Completion optimiert sind, nicht für narrative Immersion — und ein vager Prompt („schreib eine angespannte Konfrontation") den Zusammenfassungs-Heuristik auslöst. Ein strukturierter Prompt schließt diesen Ausweg. Wenn POV, ein Sinnes-Anker, ein emotionaler Beat und eine Wort-Obergrenze vorgegeben werden, hat das Modell keinen Raum zum Zusammenfassen — es muss rendern. Der sekundäre Fehler ist Drift: Das Modell beginnt im vorgegebenen Genre und Stil und regrediert dann nach 200–300 Token in ein generisches KI-Schreibregister. Einschränkungs-Anker (POV, Sinnes-Fokus, Wort-Obergrenze) verlangsamen diesen Drift; ein System-Prompt, der Genre und Stimme benennt, stoppt ihn vollständig.
💡Tip: Genre und POV im System-Prompt für Mehrfach-Turn-Sessions setzen — siehe System-Prompt vs User-Prompt warum das besser verankert als User-Turn-Anweisungen. Genre und POV in die System-Message, nicht in den User-Turn. Jede Completion in der Session erbt die Einschränkung — sie muss nicht wiederholt werden.
Vorher/Nachher: Was strukturierte Prompts wirklich bewirken
Die drei Paare unten zeigen genau, was sich ändert, wenn man von einer vagen Anfrage zu einem strukturierten Prompt wechselt — jedes Paar deckt eine andere Vorlagen-Kategorie ab.
Paar 1 — Szenen-Schreiben
❌ Vager Szenen-Prompt
“Write a tense confrontation scene in a kitchen.”
✅ Strukturierter 5-teiliger Szenen-Prompt
“Genre: literary fiction. POV: close third, Maya. Sensory anchor: the smell of burned coffee. Emotional beat: Maya realises her brother lied. Show without stating. Word ceiling: 200 words.”
- Vage Ausgabe: 2–3 Sätze Handlungszusammenfassung. „Maya konfrontierte ihren Bruder in der Küche. Die Spannung zwischen ihnen war spürbar. Er zuckte unbehaglich und schaute weg." Die Szene wird erzählt, nicht gezeigt. Die Sinnenwelt fehlt.
- Strukturierte Ausgabe: Eine 180-Wörter-gerenderte Szene, in der verbrannter Kaffee die Handlung verankert — Maya sieht Kaffeesatz im Filter von diesem Morgen, registriert, dass ihr Bruder hier war, als er sagte, er wäre es nicht, und die Szene endet auf dem physischen Detail ihrer Hände auf der Arbeitsplatte. Die Erkenntnis entsteht aus der Prosa, nicht aus einer ausgesprochenen Emotion.
Paar 2 — Charakterentwicklung
❌ Eigenschaftslisten-Charakter-Prompt
“Elena is brave, sarcastic, and loyal.”
✅ Widerspruchs-Charakter-Prompt
“Elena is pathologically honest. She hides her sister's letters from their mother. Show both without naming either. 200 words.”
- Eigenschaftslisten-Ausgabe: Ein Charakter, der jedes Merkmal der Reihe nach illustriert. „Elena betrat den Raum ohne zu zögern — sie kannte keine Angst. 'Klar,' sagte sie trocken. Sie würde alles für die Menschen tun, die sie liebte." Jedes Merkmal wird illustriert und abgehakt.
- Widerspruchs-Ausgabe: Ein Charakter, den der Leser interpretieren muss. Elena gibt spontan die falsche Kaffeebestellung an (ehrlich) und schiebt gleichzeitig einen Umschlag in die Küchenschublade, bevor ihre Mutter hereinkommt (versteckend). Der Leser muss die Wunde erschließen, die den Widerspruch erzeugt hat. Diese Lücke ist der Charakter.
Paar 3 — Dialog
❌ Direkter Dialog-Prompt
“Two friends argue about money.”
✅ Subtext-zuerst-Dialog-Prompt
“Subtext: A wants to ask B for a loan but won't say it. B knows but pretends not to. 4 exchanges, 'said' tags only, no action beats.”
- Direkte Ausgabe: Charaktere, die genau das sagen, was sie meinen. „'Du schuldest mir Geld,' sagte James. 'Ich weiß, und es tut mir leid,' sagte Paul." Der Subtext ist der Text. Der Leser kann nichts erschließen.
- Subtext-zuerst-Ausgabe: Vier Exchanges, in denen keiner der Charaktere Geld oder Kredite erwähnt. A beklagt sich über sein Auto, das repariert werden muss. B stimmt zu, dass das Auto ein Problem ist. A sagt, er müsste es vielleicht eine Weile in der Werkstatt lassen. B sagt, seine Werkstatt sei voll. Das Bedürfnis und die Ausweichung sind beide nur in dem sichtbar, was nicht gesagt wird.
Szenen-Vorlagen (Vorlagen 1–2)
Die 5-teilige Szenen-Vorlage ist die Grundlage: Genre + POV + Sinnes-Anker + emotionaler Beat + Wort-Obergrenze. Jedes Element leistet spezifische Arbeit — entferne eines davon und die Ausgabequalität sinkt messbar.
📍 In einem Satz
Der effektivste lokale LLM-Szenen-Prompt gibt Genre, POV, einen Sinnes-Anker, einen emotionalen Beat und eine Wort-Obergrenze vor — diese fünf Einschränkungen zusammen erzwingen Zeigen-statt-Erzählen-Prosa und verhindern den Standard-Zusammenfassungs-Modus des Modells.
💬 In einfachen Worten
Statt „schreib eine angespannte Konfrontationsszene" versuchen: „Genre: Thriller. POV: close third, Elena. Sinnes-Anker: das Summen der Klimaanlage. Emotionaler Beat: Elena erkennt, dass sie falsch liegt — zeig es, ohne es auszusprechen. Wort-Obergrenze: 200 Wörter." Die Ausgabe wird eine spezifische Szene sein, keine Handlungszusammenfassung. Die Wort-Obergrenze ist nicht optional — ohne sie wird das Modell aufblähen.
- Genre-Marker — einzelnes Wort oder Phrase (z.B. „Gothic Horror", „Cozy Mystery", „Hard Sci-Fi") verankert das Prosa-Register.
- POV-Marker — „close third, [Name]" oder „erste Person" setzt den grammatikalischen Rahmen und filtert alle Beobachtungen durch ein Bewusstsein.
- Sinnes-Anker — ein spezifisches Sinnesdetail (der Geruch von nassem Beton, das Ticken einer Uhr, die Textur von abgenutztem Teppich) verankert die Szene in der physischen Welt.
- Emotionaler Beat — den emotionalen Zustand benennen, auf dem die Szene landen soll, dann „zeig es ohne es auszusprechen" hinzufügen — dies aktiviert die Zeigen-statt-Erzählen-Einschränkung.
- Wort-Obergrenze — 150 Wörter für einen komprimierten Moment; 250–300 Wörter für einen vollständigen Szenen-Beat; maximal 400 Wörter, bevor eine zweite Szene angefordert wird.
Vorlage 1 — Szenen 5-Teil-Struktur
Die Grundvorlage. Alle fünf Elemente sind tragende Elemente — entferne eines und die Ausgabequalität sinkt messbar.
Genre: [literary fiction / thriller / fantasy / horror / etc.]
POV: [first person / close third, character name]
Sensory anchor: [one specific sensory detail — smell, texture, sound]
Emotional beat: [what the POV character feels at the end of this scene — do not state it directly]
Word ceiling: [150–400 words]
Write the scene. Do not summarise. Every sentence must render a moment, not describe one.Vorlage 2 — Action/Kampf Zeitkompression
Verhindert, dass das Modell Aktionen teleskopiert oder unnötige Übergangs-Prosa zwischen Beats einfügt. Die „1 Sekunde pro Satz"-Regel erzwingt mechanische Präzision und hält die Sequenz kinetisch.
Genre: [action / thriller / fantasy combat]
POV: [close third / first person, character name]
Sensory anchor: [one physical sensation — impact, sound, texture]
Time rule: every sentence represents exactly 1 second of story time
Word ceiling: [100–200 words]
Write the fight/action sequence. Enforce the time rule strictly — no sentence can span more than 1 second of story time.Charakterentwicklungs-Vorlagen (Vorlagen 3–5)
Der Widerspruchs-Prompt erzeugt tiefere Charaktere als jeder Eigenschaftslisten-Ansatz. Einem Modell eine Liste von Merkmalen zu geben („Elena ist mutig, sarkastisch und loyal") erzeugt einen Charakter, der diese Merkmale illustriert. Dem Modell ein dominantes Merkmal und ein widersprechendes Verhalten zu geben, erzeugt einen Charakter, den der Leser interpretieren muss.
- Ein dominantes Merkmal, ein widersprechendes Verhalten — der Widerspruch ist der Charakter; der Leser erschließt die Wunde oder Geschichte, die ihn erzeugt hat.
- „Benenne oder erkläre keines von beidem nicht" — diese Anweisung verhindert, dass das Modell kommentiert, und zwingt die Szene, die Bedeutung zu tragen.
- Beziehungs-Dynamik-Prompt: „Schreibe einen 200-Wörter-Exchange zwischen [Charakter A] und [Charakter B], bei dem A X will und B Y will — keiner sagt, was er wirklich will."
💡Tip: Das Charakterblatt als System-Prompt für die gesamte Session verwenden. Ein Klartext-Charakterblatt aufbauen (Name, dominantes Merkmal, widersprechendes Verhalten, Kern-Wunde, Sprachregister) und am Anfang einer Schreib-Session in die System-Message einfügen. Jeder Charakterauftritt in dieser Session wird konsistent sein. Das Blatt aktualisieren, wenn sich der Charakter über Kapitel entwickelt.
Vorlage 3 — Charakter-Widerspruchs-Prompt
Die zuverlässigste Charakterentwicklungs-Struktur. Erzeugt vielschichtige Charaktere, die der Leser erschließen muss, statt Charaktere, die eine Eigenschaftsliste illustrieren.
Character name: [Name]
Dominant trait: [one trait — "relentlessly optimistic", "pathologically honest", "obsessively controlled"]
Contradicting behaviour: [one specific action that contradicts the trait — "hides her sister's letters", "lies to the one person who believes in him"]
Write a scene (200 words max) in which both the trait and the behaviour are present and visible. Do not name or explain either.Vorlage 4 — Stimm-Isolierungs-Prompt
Isoliert die Stimme eines Charakters von Plot und Psychologie. Nützlich, um das Sprachregister vor dem Schreiben von Dialog zu etablieren oder zu überprüfen, ob ein Charakter sich von anderen im selben Manuskript unterscheidet.
Character: [Name]
Task: a mundane activity — [making coffee / waiting for a bus / washing dishes]
Write 5 lines of [Character]'s internal monologue during this task. Do not include plot information. Do not explain the character's psychology. Use the character's specific speech register only.Vorlage 5 — Backstory-Ausgrabung
Zeigt dem Leser, was den Charakter geformt hat, ohne die erwachsene Version zu zeigen. Aus einer Kindheitsszene erschlossene Backstory ist dauerhafter als erzählte Backstory.
Character (adult version): [Name — include dominant trait and contradicting behaviour in one sentence]
Write a 150-word scene from [Character]'s childhood that makes their adult behaviour inevitable — but do not show the adult version of the character. Do not name the trait or explain the connection. Show the event; let the reader infer the rest.Dialog-Vorlagen (Vorlagen 6–7)
Die Subtext-zuerst-Dialog-Vorlage erzeugt naturalistisches Sprechen. Die meisten Modelle produzieren standardmäßig Charaktere, die genau das sagen, was sie meinen — ein deutliches Anzeichen für KI-generierten Dialog. Den Subtext vor den gesprochenen Zeilen festzulegen, zwingt das Modell, die Ausweichung zu konstruieren.
- Den Subtext explizit festlegen — was jeder Charakter möchte, aber nicht sagt, und warum er es nicht sagt.
- „Keine Dialog-Tags außer 'sagte'" — entfernt die Krücke des Modells für emotionale Tags und zwingt die gesprochenen Wörter, die Emotion zu tragen.
- „Keine Action-Beats" — entfernt Bühnenanweisungen, die das Modell verwendet, um leeren Dialog zu füllen. Diese in der Überarbeitung kürzen.
- Genre-Register-Prompt: „Schreibe einen 5-Exchange-Streit zwischen [Beziehung] in [Genre]. Der Streit handelt oberflächlich von [Thema A], aber der eigentliche Streit handelt von [Thema B]. Thema B nicht benennen."
- Unterbrechungs-Prompt: „Charakter A ist mitten im Satz, als Charakter B unterbricht. Schreibe es so, dass die Unterbrechung Bs emotionalen Zustand zeigt, ohne dass B sagt, wie er sich fühlt."
💡Tip: Für Mehrfach-Charakter-Dialog jedem Charakter im System-Prompt vor der Generierung ein „Sprachregister" zuweisen. Beispiel: „Elena: formal, präzise, nie Kontraktionen. Marcus: locker, unterbricht, beginnt Sätze mit 'Hör mal,' oder 'Die Sache ist.'". Das Modell hält diese Register bei, ohne bei jedem Turn daran erinnert zu werden.
Vorlage 6 — Subtext-zuerst-Dialog
Legt fest, was jeder Charakter möchte, aber nicht sagen wird, bevor gesprochene Zeilen geschrieben werden. Zwingt das Modell, die Ausweichung zu konstruieren statt Charaktere zu schreiben, die genau das sagen, was sie meinen.
Subtext (do not include this in the dialogue itself):
[Character A] wants [X] but will not ask for it directly because [reason].
[Character B] knows [X] is what A wants but pretends not to because [reason].
Scene: [brief setting — 10 words max]
Length: [number] exchanges
Write the dialogue. No dialogue tags except "said". No internal monologue. No action beats.Vorlage 7 — Stimm-Differenzierung (3 Zustellungen)
Testet, ob Charakterstimmen unterscheidbar genug sind, um ohne Attribution identifiziert zu werden. Wenn alle drei Zustellungen gleich klingen, Sprachregister-Einschränkungen zum System-Prompt hinzufügen.
Piece of news: [state the news in one sentence]
Write this news delivered by three different characters. Each delivery should make the character's class, education level, and emotional relationship to the news immediately apparent. No exposition — voice only.
Character 1: [Name — background and relationship to the news in one sentence]
Character 2: [Name — background and relationship to the news in one sentence]
Character 3: [Name — background and relationship to the news in one sentence]Weltenbau-Vorlagen (Vorlagen 8–9)
Weltenbau-Prompts funktionieren am besten mit der konzentrischen Ring-Struktur: An einem Sinnesdetail verankern und nach außen expandieren. Mit „Beschreibe meine Fantasy-Stadt" beginnen erzeugt einen Katalog. Mit „der Geruch des Marktes bei Morgengrauen" beginnen erzeugt eine Welt, die der Leser bewohnt.
📍 In einem Satz
Weltenbau-Prompts, die an einem einzelnen Sinnesdetail verankert sind und als konzentrische Ringe strukturiert sind (Objekt → Raum → Gebäude → Straße → Viertel), erzeugen immersive Weltbeschreibung statt enzyklopädischer Kataloge.
💬 In einfachen Worten
Mit etwas Kleinem und Spezifischem beginnen — das Gewicht einer Münze, der Geruch einer Schmiede, der Klang eines bestimmten Straßenhändlers — und das Modell von dort aus nach außen expandieren lassen. Vor der Stadtebene aufhören. Mehrere kurze Weltenbau-Passagen aus verschiedenen Ankern bauen eine reichhaltigere Welt auf als eine umfassende Beschreibung es jemals wird.
- Anker-Spezifität — je spezifischer der Anker, desto spezifischer die Welt. „Der Geruch des Marktes" ist vage. „Der Geruch von Kardamom und nassem Hund vom Gewürzstand an der Ecke" erzeugt eine spezifische Welt.
- Stopp-Ring — dem Modell sagen, wo es aufhören soll zu expandieren (Raum, Gebäude, Viertel, Stadt). Ohne Stopp wird es die gesamte Welt zusammenfassen.
- „Benenne die Welt nicht" — verhindert, dass das Modell Lore-Dumping einfügt.
- „Erkläre die Geschichte nicht" — entfernt den Enzyklopädie-Reflex; Geschichte entsteht aus Details, nicht aus Erklärungen.
- Implied Technology Prompt: „Beschreibe eine Straße in deiner Welt, indem du jedes Objekt benennst, das ein Charakter innerhalb eines 30-Sekunden-Spaziergangs berührt. Keine Erzählung — nur Objektnamen, in Reihenfolge."
⚠️Warning: Weltenbau-Kataloge vermeiden. Wenn ein Weltenbau-Prompt eine Aufzählungsliste mit Fakten über die Welt erzeugt, ist der Prompt zu abstrakt. Jede Antwort, die keine gerenderte Prosa ist, sollte mit einem konkreten Anker neu angefragt werden.
Vorlage 8 — Weltenbau Konzentrische Ringe
Verankert an einem Sinnesdetail und expandiert nach außen. Verhindert enzyklopädische Kataloge und erzeugt immersive Weltbeschreibung.
Anchor: [one specific sensory detail — a smell, a sound, a texture]
POV: [observer character or omniscient]
Rings: expand from the anchor outward — object → room → building → street → district. Stop when you reach [ring level: room / building / street / district].
Word ceiling: [200–400 words]
Do not name the world. Do not explain the history. Show only what the POV character perceives in this moment.Vorlage 9 — Fraktions-Kultur durch Objekte
Zeigt Weltenbau durch materielle Kultur statt durch Beschreibung oder Exposition. Was eine Fraktion besitzt, verwendet und sichtbar hält, sagt dem Leser mehr als jede Erklärung ihrer Überzeugungen.
Faction: [name and one-line description of their core belief or function]
Describe the interior of a building used by this faction — only through the objects in the room. Do not describe the people. Do not state their beliefs. Do not explain the purpose of any object. 150 words max.Stiltransfer-Vorlagen (Vorlagen 10–11)
Stiltransfer funktioniert, wenn man die Technik benennt, nicht nur den Autor. „Schreib wie Cormac McCarthy" erzeugt eine generische Annäherung. „Schreibe mit McCarthys Technik verschachtelter Nebensätze, nur konkrete Substantive, keine Dialog-Tags" erzeugt strukturelle Treue. Für ein umfassenderes Framework zur Strukturierung von Prompts, die spezifische kreative Ausgaben erzeugen, siehe das CRAFT-Framework.
- Die Techniken spezifisch benennen — „karge Prosa" ist vage; „kurze Hauptsätze, konkrete Substantive, keine Modifikatoren" ist umsetzbar.
- Ein Sample einfügen — 2–3 Sätze der tatsächlichen Autorenprosa aktivieren Pattern-Matching im Modell effektiver als Beschreibung allein.
- „Imitiere nicht das Sample — repliziere die Technik" — verhindert direkte Paraphrasierung des Sample-Absatzes.
- Tempus- und POV-Transfer: „Überarbeite den folgenden Absatz: ändere von dritter Person Vergangenheit zu erster Person Präsens. Alle konkreten Sinnesdetails beibehalten. Keine neuen Plot-Informationen hinzufügen. Maximal 200 Wörter."
- Register-Kalibrierung: Das Modell bitten, die Techniken zu benennen, die es in einem bereitgestellten Absatz sieht, bevor es gebeten wird, diese zu replizieren — dieser Oberflächungs-Schritt verbessert die Technik-Benennungs-Genauigkeit.
💡Tip: Mistral Large für Stiltransfer. Mistral Large hält konsistentes Prosa-Register über lange Completions besser aufrecht als die meisten lokal ausführbaren Modelle. Für Stiltransfer-Aufgaben, bei denen Register-Konsistenz über mehrere Absätze wichtig ist, Mistral Large gegenüber Llama 3.3 70B bevorzugen.
Vorlage 10 — Technik-benannter Stiltransfer
Benennt spezifische Techniken statt nur den Autorennamen. Erzeugt strukturelle Treue statt oberflächlichem Pastiche.
Target style: [Author name]
Techniques to replicate (name 2–3 specifically):
1. [Technique — e.g., "sentence fragments for interiority"]
2. [Technique — e.g., "concrete Anglo-Saxon vocabulary, no Latinate abstractions"]
3. [Technique — e.g., "em dashes for interruption, never ellipsis"]
Sample passage (2–3 sentences of the author's actual prose):
"[paste sample]"
Now write [scene description] using these techniques. 200 words. Do not mimic the sample — replicate the technique.Vorlage 11 — Genre-Register-Transfer
Überträgt bestehende Prosa zwischen Genre-Registern ohne Plot-Informationen zu verändern. Nützlich, um das richtige Register für eine Szene zu finden oder für Überarbeitungen, wenn das Register nicht zum Genre passt.
Source register: [thriller / romance / horror / literary fiction / commercial fiction / etc.]
Target register: [literary fiction / commercial fiction / genre X]
Specific changes: [longer sentences / more interiority / less action description / etc.]
Rewrite the following passage in [target register]. Do not change any plot information. Word ceiling: same length as input.
[paste passage]Überarbeitungs-Vorlagen (Vorlage 12)
Überarbeitungs-Prompts brauchen ein benanntes Problem, keine allgemeine Anweisung zur Verbesserung. „Mache das besser" erzeugt minimale Oberflächenbearbeitungen. „Eliminiere jede Passiv-Konstruktion; jeder Satz muss mit einem konkreten Substantiv oder einem starken aktiven Verb beginnen" erzeugt messbare strukturelle Veränderung.
- Immer den Entwurf einfügen, nicht eine Beschreibung. Überarbeitungs-Prompts funktionieren nur, wenn der tatsächliche Entwurftext eingefügt wird. Das Problem beschreiben ohne die Prosa zu zeigen, erzeugt allgemeine Ratschläge statt eines überarbeiteten Absatzes.
- Das spezifische Problem benennen. „Überarbeite" reicht nicht. Ein strukturelles Problem identifizieren: Passiv, Adverb-Überfluss, Head-Hopping, Aufblähung oder Info-Dump.
- Head-Hopping-Fix: „Der folgende Absatz enthält POV-Verletzungen — wir hören Gedanken von mehreren Charakteren. Überarbeite ihn streng in close third [Charaktername]. Alle inneren Zugänge zu anderen Charakteren entfernen."
- Dialog-Naturalisierung: „Der folgende Dialog klingt geschrieben. Überarbeite: Charaktere dürfen sich gegenseitig unterbrechen, in Fragmenten sprechen, aneinander vorbeireden. Die gleichen ausgetauschten Informationen beibehalten."
💡Tip: Immer den Entwurf einfügen, nicht eine Beschreibung. Überarbeitungs-Prompts funktionieren nur, wenn der tatsächliche Entwurftext eingefügt wird. Den spezifischen Absatz oder Exchange einfügen, das spezifische Problem benennen und die Wort-Obergrenze für die Überarbeitung angeben.
Vorlage 12 — Überarbeitungs-Toolkit (Kompression, Passiv, Adverb-Reduktion)
Drei Überarbeitungs-Anweisungen, die das spezifische Problem benennen. Jede separat ausführen — alle drei in einem Prompt zu kombinieren erzeugt inkonsistente Ergebnisse, da das Modell eine Anweisung gegenüber den anderen priorisiert.
--- COMPRESSION ---
The following scene is [N] words. Rewrite it in [N/2] words. Preserve the emotional beat and all sensory anchors. Cut dialogue tags, action beats, and transitions first:
[paste scene]
---
--- PASSIVE VOICE ELIMINATION ---
Rewrite the following paragraph: every sentence must use active voice. If the subject is not clear, invent a concrete subject. 150 words max:
[paste paragraph]
---
--- ADVERB REDUCTION ---
Rewrite the following: remove every adverb. Replace each adverb + weak verb pair with a single strong verb. Do not add new plot information:
[paste paragraph]Redaktionelle Vorlagen (Vorlagen 13–15)
Redaktionelle Vorlagen arbeiten auf Manuskript-Ebene statt auf Szenen-Ebene. Sie helfen dabei, Kontinuitätsfehler zu erkennen, bevor sie sich häufen, Pacing-Probleme über ein ganzes Kapitel zu identifizieren und Informations-Dumps in gerenderte Prosa umzuverteilen. Nach dem Entwurf ausführen, nicht währenddessen.
💡Tip: Redaktionelle Vorlagen auf abgeschlossenen Entwürfen ausführen, nicht auf laufenden Arbeiten. Plot-Konsistenz-Check benötigt mindestens 3 Szenen; Pacing-Analyse benötigt ein vollständiges Kapitel. Auf unvollständigen Passagen erzeugen sie falsch-positive Ergebnisse.
Vorlage 13 — Plot-Konsistenz-Check
Identifiziert Kontinuitätsfehler, bevor sie sich über Kapitel häufen. Nach je 3–4 neuen Szenen ausführen, um Fehler zu erkennen, während sie noch leicht zu beheben sind.
[paste the last 3 scenes here]
Read these three scenes carefully. List every continuity error you detect: changed physical descriptions (eye colour, hair, height), location inconsistencies, timeline conflicts, object appearances that contradict earlier scenes, character knowledge they should not yet have.
Output only a flag list — one sentence per flag, 150 words maximum total. Do not summarise the scenes. Do not suggest fixes. Flag only.Vorlage 14 — Pacing-Analyse
Kartiert das Pacing über ein Kapitel, um flache Zonen zu identifizieren. Nützlich, wenn ein Kapitel auf Satzebene korrekt wirkt, aber insgesamt langsam erscheint.
[paste chapter here]
Read this chapter and mark each paragraph with: FAST / MEDIUM / SLOW.
After marking, list only the SLOW paragraphs with a one-sentence diagnosis for each: what is causing the pacing to drag (over-description, dialogue repetition, excessive interiority, unnecessary backstory insertion, etc.).
Output format: Paragraph [number]: [SLOW] — [one-sentence diagnosis]
No other commentary. No summaries. Diagnosis only.Vorlage 15 — Exposition-Smoothing
Verteilt Info-Dump-Exposition über Dialog, Aktion und Sinnesdetail neu, ohne Informationen hinzuzufügen oder zu entfernen. Verwenden wenn ein Absatz als Fakten-Liefermechanismus statt als Szene wirkt.
[paste paragraph with exposition]
This paragraph delivers exposition as a block. Rewrite it by distributing the same information across three channels:
1. A line of dialogue that reveals one piece of information through character reaction (not explanation).
2. One action beat that implies one piece of information without stating it.
3. One sensory detail that shows one piece of information without naming it.
Word ceiling: same length as the input paragraph. Do not add any new information. Do not remove any information that was in the original.Modellempfehlungen für Belletristik-Schreiben
Modellwahl ist weniger wichtig als Prompt-Struktur, aber sie ist wichtig. Ein gut strukturierter Prompt auf einem 7B-Modell übertrifft einen vagen Prompt auf einem 70B-Modell — aber bei äquivalenten Prompts halten größere Modelle Einschränkungs-Treue über längere Completions besser aufrecht.
| Aufgabe | Empfohlenes Modell | Warum |
|---|---|---|
| Allgemeines Szenen-Schreiben | Llama 3.3 70B | Starkes Anweisungsfolgen, narrative Kohärenz, bester Allrounder für eingeschränkte Prosa |
| Stiltransfer | Mistral Large | Konsistentes Prosa-Register über lange Completions; beste Register-Treue lokal ausführbarer Modelle |
| Dialog / Charakterstimme | Command R+ 104B oder Hermes 3 | Naturalistisches Sprachregister; differenziert Charakterstimmen zuverlässig über längere Exchanges |
| Weltenbau | Qwen3 32B | Stark bei strukturierter Detailgenerierung; hält das konzentrische Ring-Erweiterungsmuster zuverlässig |
| Überarbeitung / Lektorat | Llama 3.3 70B | Bestes Anweisungsfolgen für spezifische strukturelle Umschreib-Anweisungen über einen vollständigen Absatz |
| Dunkle / Uncensored Belletristik | Hermes 3 Llama 3.3 | Fine-tuned für weniger Inhaltsablehnungen; keine Cloud-Nutzungsbedingungen bei lokalem Betrieb |
💡Tip: Hardware-Mindestanforderungen für Belletristik-Modelle. Llama 3.3 70B bei Q4-Quantisierung benötigt ~40 GB VRAM oder Unified Memory (NVIDIA RTX 4090 24 GB Dual-GPU oder Apple M5 Max 64 GB). Qwen3 32B bei Q4 läuft auf 20–24 GB. Mistral Large bei Q4 benötigt ~24 GB. Für 16-GB-Systeme sind Qwen3 14B und Mistral Small die praktische Obergrenze.
Häufige Fehler
- Keine Wort-Obergrenze. Ohne Obergrenze bläht das Modell auf — es fügt Übergangs-Absätze, Action-Beats und Zusammenfassungs-Sätze hinzu. Immer eine Obergrenze setzen.
- Eigenschaftslisten statt Widersprüchen. Eine Liste von fünf Merkmalen erzeugt einen Charakter, der jedes Merkmal der Reihe nach illustriert. Ein Widerspruch zwischen zwei Merkmalen erzeugt einen Charakter, den der Leser interpretieren muss.
- **„Schreib wie [Autor]" ohne Techniken-Namen.** Nur-Autorennamen-Stiltransfer erzeugt Genre-Pastiche, keine Technik-Treue. Die spezifischen Techniken benennen, die repliziert werden sollen.
- Kein POV-Anker. Ein Szenen-Prompt ohne benannten POV erzeugt standardmäßig Head-Hopping — das Modell greift auf die inneren Zustände aller Charaktere zu, weil nichts es verbietet. Immer den POV-Charakter benennen.
- Überarbeitungs-Prompts ohne Entwurf. Das Modell bitten, das „Pacing zu verbessern" einer Szene, die beschrieben, aber nicht gezeigt wird, erzeugt allgemeine Ratschläge. Den tatsächlichen Absatz einfügen.
Quellen
- Llama 3.3 70B Modellkarte und Instruction-Following-Benchmarks — Meta AI Research
- Qwen3 32B technischer Bericht — Alibaba Cloud / Qwen Team
- Mistral Large Modelldokumentation — Mistral AI
- Command R+ 104B Spezifikation — Cohere
- Hermes 3 Fine-tune-Methodik — Nous Research
Häufig gestellte Fragen
Kann ein lokales LLM einen menschlichen Schreibpartner für Belletristik-Entwürfe ersetzen?
Für spezifische Teilaufgaben — Erstanfertigungen einer Szene, Dialogue-Variationen, Weltenbau-Detail-Durchgänge — sind lokale LLMs schnelle und zuverlässige Entwurfspartner. Sie ersetzen nicht das strategische Denken eines menschlichen Co-Autors: Sie können nicht beurteilen, ob die Szene zur Story-Linie passt, ob die Entscheidung des Charakters emotional verdient ist oder ob das Kapitel-Pacing funktioniert. Für Generierungsaufgaben verwenden; menschliches Urteil für strukturelle Entscheidungen behalten.
Was ist besser für Belletristik: Ollama, LM Studio oder SillyTavern?
Für strukturierte Prompt-Vorlagen, bei denen ein vollständiger Prompt gesendet und eine Completion empfangen wird, sind Ollama (CLI oder API) und LM Studio (OpenAI-kompatibler Endpoint) gleichwertig — das Frontend beeinflusst die Ausgabequalität nicht. SillyTavern fügt Mehrfach-Turn-Roleplay und Charakterkarten-Persistenz hinzu, aber für Szenen-Schreiben und Überarbeitungs-Prompts ist eine einfache Chat-UI oder ein API-Aufruf ausreichend.
Funktionieren diese Prompt-Vorlagen auf kleineren Modellen (7B–14B)?
Ja, aber die Einschränkungs-Treue verschlechtert sich nach ~150 Token. Kleinere Modelle folgen den ersten 2–3 Einschränkungen in einem 5-teiligen Prompt, driften dann in ihr Basis-Register. Für 7B–14B-Modelle: Wort-Obergrenze reduzieren (max. 150 Wörter), weniger gleichzeitige Einschränkungen verwenden (3-teilig statt 5-teilig) und häufigeres Überarbeiten oder Neu-Prompten erwarten. Qwen3 14B ist das stärkste kleine Modell im Test für belletristik-spezifisches Prompt-Folgen.
Wie halte ich die Charakterstimme über eine vollständige Roman-Session konsistent?
Ein Klartext-Charakterblatt aufbauen (Name, dominantes Merkmal, widersprechendes Verhalten, Sprachregister, 3 Beispiel-Dialogzeilen) und es am Session-Start in die System-Message einfügen. Für lange Sessions abgeschlossene Szenen in ein laufendes „Session-Kontext"-Dokument zusammenfassen und die letzten 200–300 Wörter der aktuellsten Szene in jeden User-Turn einschließen. Das bekämpft Kontext-Drift ohne das Kontextfenster zu überschreiten.
Was ist das beste lokale LLM für das Schreiben von dunkler oder reifer Belletristik?
Hermes 3 Llama 3.3, Dolphin 3.0 Mistral oder jedes Modell, das für weniger Inhaltsablehnungen feinabgestimmt ist. Bei lokalem Betrieb gibt es keine Cloud-Nutzungsbedingungen — das Basis-Fine-tune des Modells bestimmt, was es schreiben will und was nicht. Siehe Beste lokale LLMs für kreatives Schreiben 2026 für eine vollständige Übersicht über Uncensored-Modell-Optionen.
Kann ich diese Vorlagen in SillyTavern oder Agnai verwenden?
Ja. Alle Vorlagen in diesem Leitfaden sind Klartext — sie funktionieren in jeder Oberfläche, die Text an ein lokales Modell weiterleitet. In SillyTavern Genre und POV-Einschränkung in das System-Prompt-Feld platzieren; den User-Turn für szenenspezifische Anweisungen verwenden. In Agnai ist die Einrichtung gleichwertig. Die Vorlagen sind frontend-agnostisch.
Wie lang sollte ein Szenen-Prompt sein?
Ein Szenen-Prompt von 50–100 Wörtern erzeugt in der Praxis die besten Ergebnisse. Längere Prompts (200+ Wörter) können für komplexe Szenen funktionieren, erhöhen aber die Chance, dass das Modell einige Einschränkungen ignoriert. Für komplexe Szenen den Prompt in zwei Durchgänge aufteilen: zuerst die Szene generieren, dann einen Überarbeitungs-Prompt mit der zurückgehaltenen Einschränkung ausführen.
Verletzen Stiltransfer-Prompts das Urheberrecht?
Die Technik eines Autors zu replizieren (Satzstruktur, Zeichensetzung, narratives Register) ist keine Urheberrechtsverletzung — Stil ist nicht urheberrechtlich geschützt. Erhebliche wörtliche Passagen aus urheberrechtlich geschütztem Text zu reproduzieren ist eine Verletzung. Die Vorlagen in diesem Leitfaden verwenden 2–3 Satz-Samples als Technik-Anker, was unter das standardmäßige Bildungs-Fair-Use fällt, und die generierte Ausgabe repliziert Technik statt Inhalt.
Muss ich bei der Nutzung lokaler LLMs für Belletristik die DSGVO beachten?
Für rein lokale Generierung auf dem eigenen Gerät ist die DSGVO-Relevanz minimal: Keine personenbezogenen Daten werden an externe Auftragsverarbeiter übermittelt, da das Modell vollständig lokal läuft. Relevant wird die DSGVO, wenn deine Belletristik reale, identifizierbare Personen verwendet oder wenn du KI-generierte Inhalte auf Plattformen veröffentlichst, die personenbezogene Daten verarbeiten. In diesen Fällen gelten die üblichen Datenschutzpflichten — nicht aufgrund des Modells, sondern aufgrund der Verarbeitung und Veröffentlichung.
Welche deutschen Gesetze gelten beim Einsatz lokaler LLMs für kreatives Schreiben?
Für Standard-Belletristik ohne reale identifizierbare Personen, ohne Minderjährige in sexuellen Kontexten und ohne strafbare Inhalte ist lokale Generierung rechtlich vergleichbar mit dem Schreiben mit jedem anderen Werkzeug. Relevant werden §184b StGB (Kinderpornografie — absolutes Verbot, gilt auch für KI-generierte Inhalte) und §184c StGB (Jugendpornografie). Für Stiltransfer-Prompts gilt: die Technik eines Autors replizieren ist erlaubt; wörtliche Texte reproduzieren kann Urheberrecht verletzen. „Lokal generiert" ist in keinem dieser Fälle eine Verteidigung.