Welche Uncensored lokalen LLMs sollten Belletristik-Autoren 2026 verwenden?

Hermes 3 Llama 3.3 ist das beste Allround-Uncensored-Modell für Belletristik in 2026 — starkes Anweisungsfolgen, gute Charakterstimmen-Differenzierung, weniger willkürliche Ablehnungen ohne die aggressive Ausgabe, die manche vollständig Uncensored-Fine-Tunes produzieren. Dolphin 3.0 Mistral ist die leichtere Alternative für 16–24-GB-Systeme. Für Autoren, die gelegentlich dunkle Inhalte statt persistenter Uncensored-Ausgabe benötigen, generieren Standard-Instruction-Tuned-Modelle (Llama 3.3 70B, [Qwen3](https://ollama.com/library/qwen3) 32B) mit gut strukturierten Prompts die meisten reifen literarischen Inhalte ohne Uncensored-Fine-Tune. Die ethische Grundlinie, die unabhängig vom Modell gilt: keine Inhalte, die Minderjährige in sexuellen Kontexten involvieren, keine nicht-konsensuellen Darstellungen identifizierbarer realer Personen, und sorgfältige Überlegung vor der öffentlichen Verbreitung.

Startseite/Lokale LLMs Pro/Uncensored Local LLMs für kreatives Schreiben: Wann Autoren sie brauchen (2026)

Creative & Roleplay

Uncensored Local LLMs für kreatives Schreiben: Wann Autoren sie brauchen (2026)

Aktualisiert: 2026-05-07·13 Min. Lesezeit·Von Hans Kuepper · Gründer von PromptQuorum, Multi-Model-AI-Dispatch-Tool · PromptQuorum

Lesen auf:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

Uncensored lokale LLMs sind für Belletristik-Autoren geeignet, die moralisch komplexe Charaktere, dunkle Themen, Gewalt, reife romantische Inhalte oder Stimmen unzuverlässiger Erzähler generieren müssen, die Cloud-Modelle ablehnen. Sie sind nur dann geeignet, wenn die Ausgabe für kreative Belletristik mit erwachsenem Publikum verwendet wird — nicht als Werkzeug zur Produktion realer schädlicher Inhalte, nicht-konsensueller Darstellungen realer Personen oder Inhalte, die Minderjährige in sexuellen Kontexten involvieren. Die Modelle, die den meisten Belletristik-Anwendungsfällen im Jahr 2026 entsprechen, sind Hermes 3 Llama 3.3 (weniger Ablehnungen, starkes Anweisungsfolgen) und Dolphin 3.0 Mistral (breiteres Uncensored-Spektrum, kleinerer Speicherbedarf). Beide laufen vollständig lokal über Ollama oder LM Studio, ohne dass Daten dein Gerät verlassen. Die ethischen Verantwortlichkeiten bei der Nutzung dieser Modelle sind nicht null — Autoren, die mit Uncensored-Modellen arbeiten, haben weiterhin Pflichten bezüglich Verbreitung, Minderjährigen und realen Personen, die kein lokales Setup beseitigt.

Uncensored lokale LLMs ermöglichen Autoren, reife, moralisch komplexe und düstere Inhalte zu generieren, die Cloud-Dienste ablehnen — ohne dass Daten dein Gerät verlassen. Dieser Leitfaden behandelt die geeigneten Modelle, die Einrichtung über Ollama oder LM Studio, die ethischen Verantwortlichkeiten die auch ohne ToS-Durchsetzung gelten, und die spezifischen Anwendungsfälle, für die Uncensored-Modelle geeignet bzw. ungeeignet sind.

Präsentation: Uncensored Local LLMs für kreatives Schreiben: Wann Autoren sie brauchen (2026)

Die Präsentation zeigt: was „Uncensored"-Fine-Tuning wirklich bedeutet (RLHF-Entfernung vs. null Einschränkungen); eine 5-Modell-Vergleichstabelle (Hermes 3 Llama 3.3 bis Dolphin 3.0 Mistral Small mit VRAM, Ablehnungsrate, Anweisungsqualität); geeignete und ungeeignete Anwendungsfälle; Ollama-Einrichtungsbefehle; bleibende ethische Verantwortlichkeiten; und 5 häufige Fehler. Als PDF-Referenzkarte für Uncensored-LLM-Kreativschreiben herunterladen.

Folien unten ansehen oder als PDF herunterladen. Präsentation herunterladen (PDF)

Wichtigste Erkenntnisse

„Uncensored" bedeutet, das Modell hat reduziertes RLHF-Sicherheits-Fine-Tuning — nicht dass es gar keine Einschränkungen hat. Uncensored-Fine-Tunes folgen weiterhin dem Anweisungsformat, halten die Charakterkonsistenz aufrecht und können mit Prompts gesteuert werden. Es sind keine „Alles erlaubt"-Systeme.
Hermes 3 Llama 3.3 ist die beste Allroundwahl für Belletristik-Autoren in 2026. Weniger willkürliche Ablehnungen, starkes Anweisungsfolgen, gute Charakterstimmen-Differenzierung. Die richtige Wahl für Autoren, die die Fähigkeit ohne die aggressive Ausgabe einiger vollständig Uncensored-Modelle wollen.
Standard-Instruction-Tuned-Modelle verarbeiten die meisten reifen literarischen Inhalte mit guten Prompts. Gewalt, moralische Komplexität, dunkle Psychologie und reife Themen in literarischer Prosa erfordern selten ein Uncensored-Fine-Tune. Was sie ablehnen, sind explizite sexuelle Inhalte und detaillierte Beschreibungen realer Schäden. Wisse, welche Kategorie dein Werk fällt, bevor du das Modell wechselst.
Lokal laufen bedeutet keine Daten verlassen dein Gerät. Keine Cloud-AGB gelten. Keine Inhalte werden protokolliert, analysiert oder für Training verwendet. Das ist der Hauptstrukturgrund, warum Autoren lokale Uncensored-Modelle verwenden — Datenschutz plus keine Nutzungsbeschränkungen bei Belletristik.
Ethische Verantwortlichkeiten verschwinden nicht, weil es keine ToS-Durchsetzung gibt. Autoren, die mit Uncensored-Modellen produzierte Belletristik verbreiten, tragen dieselben rechtlichen Verantwortlichkeiten wie jeder andere Autor: Minderjährige, reale Personen, Aufstachelung und jurisdiktionsspezifische Gesetze gelten unabhängig von der Generierungsmethode.
Dolphin 3.0 Mistral ist die leichtere Option für 16–24-GB-Rigs. Breiteres Uncensored-Ausgabespektrum als Hermes 3, aber schwächeres Anweisungsfolgen bei komplexen Szenen. Geeignet für Kurzform-Belletristik, Prompt-Erkundung und Stil-Tests.
SillyTavern und Agnai können beide sauber mit Uncensored-Ollama-Modellen kombiniert werden. Zeige eines der Frontends auf den Ollama-OpenAI-kompatiblen Endpoint und wähle das Uncensored-Modell. Keine zusätzliche Konfiguration erforderlich.

Schnelle Fakten

Getestete Uncensored-Modelle: Hermes 3 Llama 3.3 (primär), Dolphin 3.0 Mistral (sekundär).
Backends: Ollama (primär), LM Studio (Alternative für GUI-Einrichtung).
Hardware: Hermes 3 70B bei Q4 benötigt ~42 GB; Dolphin 3.0 7B läuft auf 8 GB; Dolphin 3.0 24B läuft auf ~16 GB.
Frontends: SillyTavern, Agnai, RisuAI können alle mit Uncensored-Ollama-Modellen über einen OpenAI-kompatiblen Endpoint kombiniert werden.
Datenschutz: vollständig lokal — keine Cloud-API-Aufrufe, kein Logging, keine Trainingsdatenerfassung.
Harte ethische Grenzen: keine sexuellen Inhalte mit Minderjährigen (absolut), keine nicht-konsensuellen sexuellen Darstellungen identifizierbarer realer Personen, keine Inhalte zur Erleichterung realer Gewalt.
Verbreitung: Inhalte, die du veröffentlichst, tragen autorschaftliche Verantwortung unabhängig von der Generierungsmethode.

Was „Uncensored" wirklich bedeutet

„Uncensored" im Kontext von lokalen LLM-Fine-Tunes bedeutet reduziertes RLHF-Sicherheitstraining (Reinforcement Learning from Human Feedback) — nicht die Entfernung aller Modellbeschränkungen. Standard-Instruction-Tuned-Modelle werden mit RLHF-Schichten trainiert, die sie dazu bringen, bestimmte Inhaltskategorien abzulehnen: explizite sexuelle Inhalte, detaillierte Gewalt, dunkle Psychologie, die einer echten Schadensvorlage ähnelt. Uncensored-Fine-Tunes (Hermes 3, Dolphin, Wizard, Erebus) entfernen oder reduzieren diese RLHF-Schichten aus dem Basismodell, behalten die Anweisungsfolge-Fähigkeit bei, entfernen aber die Ablehnungsverhalten. Das Ergebnis ist ein Modell, das deinen Belletristik-Prompts durch dunkle Inhalte folgt, ohne umzuleiten, zu moralisieren oder mittendrin zu stoppen.

📍 In einem Satz

Uncensored lokale LLM-Fine-Tunes entfernen RLHF-Sicherheitsablehnungs-Schichten und behalten dabei die Anweisungsfolge-Fähigkeit — sie folgen dunklen kreativen Richtungen, ohne umzuleiten, zu moralisieren oder mittendrin zu stoppen.

💬 In einfachen Worten

Ein Standardmodell wie Llama 3.3 70B stoppt mitten in einer Szene, die Folter, einen moralisch komplexen Schurken-Monolog oder explizite romantische Inhalte darstellt, und lehnt entweder ab oder weicht der Ausgabe aus. Hermes 3 (die Uncensored-Version auf derselben Basis) folgt deinem Prompt durch dieselbe Szene auf demselben Qualitätsniveau ohne Unterbrechung. Die Prosaqualität ist gleichwertig; der Unterschied ist die Ablehnungsschicht.

Was entfernt wird: Ablehnungsverhalten für bestimmte Inhaltskategorien (explizite sexuelle Inhalte, grafische Gewalt, dunkle psychologische Inhalte).
Was erhalten bleibt: Anweisungsfolgen, Charakterkonsistenz, Prompt-Struktur-Einhaltung, Sprachqualität.
Grade des Uncensoring: Hermes 3 ist selektiv Uncensored (reife Inhalte ja, aber behält einige Leitplanken für extreme Inhalte). Dolphin-Serie ist breiter Uncensored. Vollständig abliterierte Modelle (Wizard-Uncensored, Erebus) haben die aggressivste Entfernung von Leitplanken — und das schwächste Anweisungsfolgen für komplexe Belletristik-Aufgaben.
Basismodell-Qualität zählt: Uncensoring verschlechtert die Anweisungsqualität, wenn das Basismodell schwach ist. Hermes 3 auf Llama 3.3 70B behält Llama 3.3's starkes Anweisungsfolgen; Dolphin 3.0 auf Mistral Small ist durch die kleinere Basis begrenzt.

💡Tip: Uncensored bedeutet nicht unsteuerbar. Uncensored-Modelle folgen weiterhin der Prompt-Struktur, respektieren Wortgrenzen, halten die Charakterstimme aufrecht und reagieren auf Überarbeitungsanweisungen. Der Unterschied ist, dass sie keine unaufgeforderten Inhaltshinweise hinzufügen, moralisch dunkle Richtungen ablehnen oder mittendrin aus der Rolle fallen, um darauf hinzuweisen, dass eine Szene Schaden darstellt. Verwende strukturierte Prompts aus den Belletristik-Schreib-Vorlagen wie bei jedem anderen Modell — der System-Prompt-zu-User-Prompt-Unterschied ist wichtiger als das Uncensored-Level des Modells.

Wie wir getestet haben

Die Modellbewertungen in diesem Leitfaden basieren auf einem kleinen qualitativen Test — ein Richtungsindikator, kein Peer-Review-Benchmark. Für ein Thema, bei dem Leser entscheiden, ob sie Modellempfehlungen zu einem sensiblen Thema vertrauen sollen, ist Transparenz zur Methode wichtig.

Prompt-Set: 10 Prompts in 5 Kategorien — Schurken-Monolog, reife Romanzen-Szene, grafische Gewalt in Kriegsbelletristik, moralisch komplexer Erzähler, dunkle psychologische Szene (2 Prompts pro Kategorie).
Durchläufe pro Modell: jeder Prompt 3 Mal pro Modell ausgeführt.
Ablehnungsrate: Prozentsatz der Durchläufe, bei denen das Modell den angeforderten Inhalt abgelehnt, umgeleitet oder unaufgefordert gemildert hat.
Drift-Messung: Prozentsatz der Durchläufe, bei denen das Modell unaufgeforderte Eskalation hinzufügte — grundlose Extreme jenseits des Prompt-Spezifischen.
Backend: Ollama 0.5+ mit Q4_K_M-Quantisierung für alle Modelle.
Ehrlichkeitseinschränkung: kleiner qualitativer Test. Ergebnisse zeigen Richtungsunterschiede zwischen Modellen, keine präzisen numerischen Messungen. Behandle die Werte in der Drift-zu-Extremen- und Ablehnungsrate-Tabelle als repräsentative Urteile.

Wann Uncensored-Modelle für Belletristik geeignet sind

Uncensored-Modelle sind geeignet, wenn deine Belletristik wirklich Inhalte benötigt, die Cloud-Dienste ablehnen, dein Publikum erwachsen ist und der Zweck kreative Expression ist. Die meisten Belletristik-Autoren greifen auf Uncensored-Modelle für einen oder mehrere dieser spezifischen Anwendungsfälle zurück.

Schurken-Psychologie und Monologe: moralisch kohärente Schurken-Charaktere, die nicht durch das Modell unterbrochen werden, das mittendrin aus der Rolle fällt, um Haftungsausschlüsse hinzuzufügen.
Reife romantische und sexuelle Inhalte: explizite Szenen zwischen erwachsenen fiktiven Charakteren in Romantik, Erotik oder Literaturbelletristik, die sexuelle Inhalte erfordern, die Cloud-Dienste blockieren.
Grafische Gewalt in Genre-Belletristik: Kriegsromane, Krimis, Horror — Szenen, in denen Gewalt für den emotionalen Eindruck traglasttragend ist und ihre Abschwächung die Szene zerstört.
Trauma und psychologische Dunkelheit: Überlebenden-Narrative, Sucht-Belletristik, Missbrauchs-Storylines — Inhalte, die eine ungeschönte Darstellung erfordern, um authentisches Gewicht zu haben.
Moralisch unzuverlässige Erzähler: Erzähler, die falsch liegen, Schaden rationalisieren, innerhalb der Belletristik grausam oder voreingenommen sind — Charaktere, die erfordern, dass das Modell Ansichten äußert, die es normalerweise ablehnen würde.
Dunkles Roleplay und kollaborative Belletristik: lang laufende Szenarien mit Konflikten, moralischer Komplexität und reifen Themen, bei denen ein Standardmodell die Fiktion bricht, um Ablehnungen einzufügen.

💡Tip: Bevor du zu einem Uncensored-Modell wechselst, teste deinen Prompt zunächst auf einem Standard-Instruction-Tuned-Modell. Llama 3.3 70B und Qwen3 32B mit einem gut strukturierten System-Prompt und Szenen-Einschränkungen generieren die meisten reifen literarischen Inhalte ohne Ablehnungen. Uncensored-Fine-Tunes bieten den größten Mehrwert für explizite sexuelle Inhalte und die extremsten Darstellungen von Gewalt — nicht für psychologische Dunkelheit, moralische Komplexität oder dunkle Themen im Allgemeinen.

Wann sie nicht geeignet sind

Das Fehlen von Cloud-Durchsetzung bedeutet nicht das Fehlen rechtlicher und ethischer Verpflichtungen. Diese Kategorien stellen harte Grenzen dar, die unabhängig von Modell, Plattform oder ob dein Gerät luftabgeschirmt ist, gelten.

Sexuelle Inhalte mit Minderjährigen: absolutes gesetzliches Verbot in allen wichtigen Rechtsordnungen, unabhängig von fiktionaler Rahmung oder Generierungsmethode. In Deutschland strafbar nach §184b StGB — dies ist kein Modell-Policy, sondern Gesetz.
Nicht-konsensuelle sexuelle Darstellungen realer Personen: NCII-Gesetze gelten für KI-generierte Inhalte identifizierbarer realer Personen in einer wachsenden Zahl von Rechtsordnungen. „Von KI generiert" ist keine Verteidigung.
Inhalte zur Erleichterung realen Schadens: die Nutzung einer Belletristik-Rahmung zur Extraktion von Informationen oder Inhalten, die reale Gewalt oder Schaden direkt ermöglichen, beseitigt den Belletristik-Schutz.
Öffentliche Verbreitung ohne autorschaftliche Verantwortung: Inhalte, die du veröffentlichst, verbreitest oder teilst, tragen autorschaftliche Verantwortung. „Eine KI hat es geschrieben" überträgt diese Verantwortung nicht.
Belästigungs-Belletristik: Generierung von Belletristik, deren Zweck es ist, eine bestimmte reale Person zu schädigen, einzuschüchtern oder zu belästigen — unabhängig davon, ob sie als Belletristik gerahmt ist. In Deutschland kann dies als Volksverhetzung (§130 StGB) oder Beleidigung (§185 StGB) strafbar sein.

⚠️Warning: Harte Grenzen unabhängig vom Setup. Keine lokale Konfiguration beseitigt rechtliche oder ethische Verantwortung für: (1) sexuelle Inhalte mit Minderjährigen — absolutes gesetzliches Verbot nach §184b StGB in praktisch jeder Rechtsordnung; (2) nicht-konsensuelle sexuelle Darstellungen identifizierbarer realer Personen — dies stellt NCII dar unabhängig von der Generierungsmethode; (3) Inhalte, die zur Erleichterung realer Gewalt gegen spezifische Ziele konzipiert sind. Diese Grenzen gelten, ob dein Modell lokal, in einer Cloud oder auf einem luftabgeschirmten Gerät läuft.

Modellvergleich: Uncensored-Optionen für Belletristik

Nicht alle Uncensored-Modelle sind gleich — der Grad der RLHF-Entfernung und die Qualität des Basismodells sind beide relevant für Belletristik-Anwendungsfälle.

Hinweis: ältere Uncensored-Fine-Tunes — Midnight Miqu (Miqu-70B-basiert), Wizard-LM Uncensored, Mythomax — waren 2024 führend, wurden aber 2026 von Hermes 3 und Dolphin 3.0 in Qualitäts- und Anweisungsfolge-Metriken übertroffen. Falls du sie in älteren Artikeln empfohlen findest, sind die aktuellen Äquivalente Hermes 3 (für selektives Uncensoring) und Dolphin 3.0 (für breiteres Spektrum).

Modell	Basis	VRAM (Q4)	Ablehnungsrate	Anweisungsqualität	Tendenz zu Extremen	Bestes Einsatzgebiet
Hermes 3 Llama 3.3 70B	Llama 3.3 70B	~42 GB	Selektiv	★★★★★	Gering	Standardwahl für ernsthafte Belletristik — bestes Anweisungsfolgen + Uncensored-Fähigkeit
Dolphin 3.0 Mistral 24B	Mistral 24B	~16 GB	Breit	★★★★☆	Gering-Mittel	16–24-GB-Systeme; reife Inhalte über eine breitere Spanne
Dolphin 3.0 Mistral Small	Mistral Small	~8 GB	Breit	★★★☆☆	Mittel	VRAM-arme Systeme; Kurzentwürfe, Prompt-Tests
Hermes 3 Llama 3.2 8B	Llama 3.2 8B	~5 GB	Selektiv	★★★☆☆	Gering	Ressourcenbegrenzte Systeme; Dialog und kürzere Szenen
Standard Llama 3.3 70B	Llama 3.3 70B	~42 GB	Begrenzt	★★★★★	Keine	Dunkle Themen, moralische Komplexität, Gewalt — ohne explizit sexuellen Inhalt

💡Tip: Beginne mit Hermes 3, nicht dem aggressivsten Uncensored-Fine-Tune. Vollständig abliterierte Modelle (Wizard-Uncensored, Erebus) haben die breiteste Inhaltspalette, aber merklich schwächeres Anweisungsfolgen bei komplexen Belletristik-Aufgaben — sie weichen schneller von Einschränkungen ab, produzieren bei längerer Generierungsdauer Prosa mit niedrigerer Qualität und halten die Charakterstimme weniger zuverlässig. Für Belletristik, die sowohl Uncensored-Inhalte als auch Qualitätsprosa erfordert, ist Hermes 3 der bessere Kompromiss.

Einrichtung: Ollama und LM Studio

Sowohl Ollama als auch LM Studio bedienen Uncensored-Modelle über eine OpenAI-kompatible lokale API — was bedeutet, dass SillyTavern, Agnai und jedes andere Tool, das mit einem lokalen Endpoint spricht, ohne zusätzliche Konfiguration funktioniert.

Ollama: Hermes 3 laden und starten

“# Pull the model ollama pull nous-hermes3:70b-llama3.3-q4_K_M # Run it ollama run nous-hermes3:70b-llama3.3-q4_K_M # Serve via API (for SillyTavern / Agnai / LM Studio-compatible tools) ollama serve # API available at http://localhost:11434”

Ollama: Dolphin 3.0 Mistral 24B laden und starten

“# Pull the model ollama pull dolphin3:24b-mistral-q4_K_M # Verify it loaded ollama list # Run a test prompt ollama run dolphin3:24b-mistral-q4_K_M "Write a 100-word villain monologue, gothic register, no disclaimers."”

Ollama-Installation: brew install ollama (macOS) oder Download von ollama.com (Windows/Linux). Der Befehl ollama serve startet die OpenAI-kompatible API unter http://localhost:11434.
LM Studio-Installation: Download von lmstudio.ai. GGUF-Modelldateien direkt importieren; der lokale Server-Tab stellt einen OpenAI-kompatiblen Endpoint unter http://localhost:1234 bereit.
SillyTavern-Verbindung: in den API-Einstellungen „OpenAI-kompatibel" auswählen und die Basis-URL auf http://localhost:11434/v1 (Ollama) oder http://localhost:1234/v1 (LM Studio) zeigen. Einen beliebigen String als API-Schlüssel eingeben (vom Feld benötigt, wird aber lokal nicht validiert).
Agnai-Verbindung: derselbe OpenAI-kompatible Endpoint; lokale URL in den Adapter-Einstellungen eingeben. Funktioniert identisch zur SillyTavern-Einrichtung.
Modellwechsel: in Ollama zwischen Standard- und Uncensored-Modellen mit `ollama run [modell-name]` wechseln — mehrere Modelle können gleichzeitig geladen werden, und du kannst pro Session wechseln, ohne den Server neu zu starten.

💡Tip: Für Autoren, die Uncensored- und Standard-Modelle separat halten möchten, erstelle zwei Ollama-Instanzen auf verschiedenen Ports mit der OLLAMA_HOST-Umgebungsvariable. Beispiel: OLLAMA_HOST=127.0.0.1:11435 ollama serve. Damit kannst du SillyTavern oder Agnai auf die Uncensored-Instanz zeigen, während deine Standard-Ollama-Instanz für andere Aufgaben bestehen bleibt.

Bleibende ethische Verantwortung

Ein Modell lokal ohne Cloud-Policy-Durchsetzung zu betreiben, beseitigt nicht deine Verantwortlichkeiten als Autor und Verleger. Der ethische Rahmen, der für menschlich verfasste Belletristik gilt, gilt gleichermaßen für KI-unterstützte Belletristik.

📍 In einem Satz

Lokales Setup beseitigt Cloud-ToS-Einschränkungen, aber nicht die rechtliche Autorenverantwortung, die Haftung für die Ermöglichung von Schaden oder die ethischen Verpflichtungen, die für jedes veröffentlichte kreative Werk gelten.

💬 In einfachen Worten

Denke an das lokale Uncensored-Modell als einen sehr fähigen Schreib-Assistenten, der jede Anweisung befolgt, die du gibst. Das rechtliche und ethische Gewicht dessen, was du produzierst und verbreitest, liegt bei dir, nicht beim Werkzeug. Dieselben Gesetze, die für menschlich verfasste Belletristik gelten — bezüglich Minderjähriger, realer Personen, Obszönität und Aufstachelung — gelten für öffentlich verbreitete KI-generierte Belletristik. Die Tatsache, dass keine Plattform dich daran hindert, den Inhalt lokal zu generieren, ändert nichts an deiner rechtlichen Verantwortung, wenn du ihn veröffentlichst.

Autorenverantwortung: du bist der Autor KI-unterstützter Belletristik. „Die KI hat es generiert" überträgt nicht das Urheberrecht, beseitigt nicht die Haftung oder stellt keine Verteidigung für Inhalte dar, die gegen Gesetze verstoßen.
Jurisdiktionsbewusstsein: Obszönität, NCII und schädliche Inhaltsgesetze variieren je nach Jurisdiktion. In Deutschland sind relevante Gesetze §130 StGB (Volksverhetzung), §184b StGB (Kinderpornografie) und §3 KUG (Recht am eigenen Bild). Inhalte, die in einem Land legal zu produzieren sind, können in einem anderen strafrechtlich relevant sein.
Reale Personen: das Generieren negativer fiktiver Inhalte über identifizierbare reale Personen — auch in klar fiktionalen Rahmen — birgt Verleumdungs- und NCII-Risiken je nach Inhalt.
Altersverifizierung für Verbreitung: wenn du reife oder erwachsene Inhalte, die mit Uncensored-Modellen produziert wurden, auf einer öffentlichen Plattform verbreitest, gelten Altersverifizierungspflichten, die für jeden Erwachsenen-Inhalte-Verleger gelten, auch für dich.
Verantwortungsvolles Archivieren: lokal generierte Uncensored-Inhalte sollten mit derselben Speicherdisziplin wie jedes andere sensible Material behandelt werden — nicht in cloud-synchronisierten Verzeichnissen gespeichert, nicht unbeabsichtigt geteilt.

⚠️Warning: Der häufigste ethische Fehler bei Autoren, die Uncensored-Modelle verwenden, ist die lokale Generierung als kontextfreie Zone zu behandeln. Lokale Generierung bedeutet keine Plattform-Policy-Durchsetzung — es bedeutet nicht kein Gesetz, keine Verantwortung und keinen Schaden. Das Fehlen eines Inhaltsmoderatorors ist keine Genehmigung.

Praktischer Workflow für Belletristik-Autoren

Die meisten Belletristik-Autoren, die Uncensored-Modelle verwenden, setzen sie für spezifische Szenen ein, nicht als Standard-Ersatz für ihr Standardmodell. Der folgende Workflow unterstützt diese gezielte Verwendung.

Standardszenen mit einem Standardmodell entwerfen. Llama 3.3 70B oder Qwen3 32B verarbeiten den Großteil der literarischen Prosa einschließlich dunkler Themen, moralischer Komplexität und psychologischer Tiefe. Das Uncensored-Modell für Szenen reservieren, die speziell Inhalte erfordern, die das Standardmodell ablehnt.
Für gezielte Szenen zu Uncensored wechseln. In Ollama ollama run nous-hermes3:70b-llama3.3-q4_K_M für die spezifische Szene ausführen. In SillyTavern das Modell in den API-Einstellungen pro Session ändern. Keine Daten werden zwischen Sessions übertragen.
Dieselben Prompt-Vorlagen verwenden. Die 5-teilige Szenen-Vorlage, Subtext-Dialog-Struktur und Charakter-Widerspruchs-Prompts aus Local LLM Prompts for Fiction Writers funktionieren identisch auf Uncensored-Modellen. Du brauchst keine anderen Prompt-Strukturen.
Keine Inhaltsgenerierungs-Anweisungen hinzufügen, die nicht in einem menschlich verfassten Brief erscheinen würden. Das Modell ist ein Werkzeug, keine Erlaubnisstruktur. Wenn du eine Anweisung aus rechtlichen Gründen nicht in ein Brief an einen menschlichen Illustrator oder Ghost-Writer aufnehmen würdest, füge sie auch nicht in den Modell-Prompt ein.
Ausgabe vor der Verbreitung überprüfen. Uncensored-Modelle produzieren gelegentlich Inhalte, die die angeforderte Dunkelheit überschreiten oder in Stereotypisierung abgleiten. Das Standard-redaktionelle Überprüfen KI-unterstützter Inhalte gilt.

💡Tip: Führe ein „Modell-Log" pro Schreibprojekt — eine Klartext-Datei, die aufzeichnet, welches Modell welche Szenen generiert hat. Dies ist nützlich für die Überarbeitung, für Zuschreibungstransparenz, wenn du KI-Unterstützung offenlegst, und für die Überprüfung, wenn eine Szene später Fragen aufwirft.

Häufige Fehler

Standardmäßig das aggressivste Uncensored-Modell verwenden. Vollständig abliterierte Modelle (Wizard-Uncensored, Erebus) haben das schwächste Anweisungsfolgen für komplexe Szenen. Hermes 3 ist ein besserer Kompromiss für Belletristikqualität.
Uncensored-Modelle für Inhalte verwenden, die Standardmodelle generieren würden. Moralische Komplexität, dunkle Psychologie, Gewalt und reife Themen in literarischer Prosa erfordern selten ein Uncensored-Fine-Tune. Wisse genau, was du brauchst, bevor du wechselst.
Lokale Generierung als rechtlich kontextfreie Zone behandeln. Keine Cloud-Policy-Durchsetzung bedeutet nicht kein Gesetz. Autorenverantwortung für Verbreitung, reale Personen und Minderjährige gilt unabhängig.
Wortgrenzen nicht festlegen. Uncensored-Modelle füllen dunkle Inhalte genauso bereitwillig wie jedes andere Modell auf. Dieselben Wortgrenzen-Einschränkungen aus den Belletristik-Vorlagen verwenden.
Ausgabe in cloud-synchronisierten Verzeichnissen speichern. Lokal generierte reife Inhalte, die mit iCloud, Google Drive oder OneDrive synchronisiert werden, können gegen die Nutzungsbedingungen dieser Plattformen verstoßen. Nur lokal speichern.

Quellen

Hermes 3 Modellkarte und Fine-Tuning-Methodik — Nous Research
Dolphin 3.0 Mistral technische Dokumentation — Cognitive Computations / Eric Hartford
RLHF- und Alignment-Techniken Übersicht — Anthropic Research
EU KI-Gesetz Artikel 5 — verbotene KI-Praktiken einschließlich Inhalte mit Minderjährigen — EUR-Lex
NCII (Nicht-Konsensuelle Intime Bilder) — rechtliche Rahmenübersicht — Cyber Civil Rights Initiative

Häufig gestellte Fragen

Ist es legal, Uncensored lokale LLMs zu betreiben?

Das Betreiben eines Uncensored lokalen LLMs ist in den meisten Jurisdiktionen legal — es gibt kein Gesetz gegen den Besitz von Open-Source-KI-Software. Was du damit generierst und verbreitest, unterliegt denselben Gesetzen wie jeder andere verfasste Inhalt: Obszönitätsrecht, NCII-Recht, Verleumdungsrecht und Gesetze bezüglich Inhalten mit Minderjährigen. Legal zu betreiben bedeutet nicht legal zu veröffentlichen, zu teilen oder unbegrenzt zu verbreiten.

Was ist der Unterschied zwischen Hermes 3 und Dolphin 3.0?

Hermes 3 (Nous Research) ist selektiv Uncensored — es reduziert Ablehnungen für reife Inhalte, behält aber einige Leitplanken für extreme Kategorien. Anweisungsfolgen ist ausgezeichnet, nahe am Basis-Llama-3.3-70B-Modell. Dolphin 3.0 (Cognitive Computations) ist breiter Uncensored über ein weiteres Inhaltsspektrum, aber Anweisungsfolgen ist bei komplexen Multi-Constraint-Szenen etwas schwächer. Hermes 3 ist der bessere Standard für Belletristik, bei der Prosaqualität wichtig ist; Dolphin 3.0 ist die bessere Wahl, wenn du das breiteste Inhaltsspektrum auf einem 16–24-GB-System benötigst.

Brauche ich ein Uncensored-Modell, um dunkle Belletristik zu schreiben?

Nein, für die meisten dunklen Belletristik. Standard-Instruction-Tuned-Modelle wie Llama 3.3 70B und Qwen3 32B generieren Gewalt, moralische Komplexität, dunkle Psychologie, Schurken-Innenleben, Trauma und die meiste literarische Dunkelheit ohne Ablehnungen, wenn sie richtig geleitet werden. Was sie zuverlässig ablehnen, sind explizite sexuelle Inhalte und eine engere Menge extremer Szenarien. Wenn deine dunkle Belletristik keinen expliziten sexuellen Inhalt enthält, versuche zunächst ein Standardmodell.

Kann ich Uncensored-Modelle in SillyTavern oder Agnai verwenden?

Ja. Sowohl SillyTavern als auch Agnai verbinden sich mit jedem OpenAI-kompatiblen Endpoint — einschließlich Ollama, das lokal auf Port 11434 läuft. Das Uncensored-Modell in Ollama laden, ollama serve starten und in SillyTavern oder Agnai die OpenAI-kompatible API auswählen und auf http://localhost:11434/v1 zeigen. Uncensored-Modell aus der Modellliste auswählen. Keine zusätzliche Konfiguration erforderlich.

Sind Uncensored-Modelle sicher im Heimnetzwerk zu verwenden?

Ja, wenn sie so konfiguriert sind, dass sie an localhost binden (die Standardeinstellung in Ollama und LM Studio). Die API ist nur von deinem Gerät aus zugänglich. Wenn du den Port im Heimnetzwerk freigibst, stelle sicher, dass Firewall-Regeln den Zugriff auf vertrauenswürdige Geräte beschränken. Die Ollama-API nicht ohne Authentifizierung im öffentlichen Internet freigeben — die Standardkonfiguration hat keine Authentifizierung.

Was passiert mit dem lokal generierten Inhalt?

Automatisch passiert nichts damit. Lokal generierte Inhalte werden nicht an einen Server gesendet, nicht von einem Cloud-Dienst protokolliert und nicht für Model-Training verwendet. Sie existieren nur auf deinem Gerät. Du kontrollierst, was du behältst, was du löschst und was du teilst. Das ist der primäre strukturelle Datenschutzvorteil lokaler Uncensored-Generierung gegenüber cloudbasierten Alternativen.

Kann ich Uncensored- und Standard-Modelle im selben Schreibprojekt mischen?

Ja, und dies ist der empfohlene Workflow. Ein Standardmodell (Llama 3.3 70B, Qwen3 32B) für den Großteil der Prosa verwenden. Für spezifische Szenen, die Inhalte erfordern, die das Standardmodell ablehnt, zu Hermes 3 oder Dolphin 3.0 wechseln. Dieselben Prompt-Vorlagen funktionieren auf beiden; der Prosastil ist konsistent genug, dass eine szenenweise Mischung im Output nicht erkennbar ist.

Beeinflusst die Generierung mit einem Uncensored-Modell das Urheberrecht?

Nein — die Urheberrechtssituation für KI-generierte Inhalte ist unabhängig davon identisch, ob das Modell zensiert oder Uncensored ist. Das Urheberrecht für KI-Ausgaben ist in den meisten Jurisdiktionen seit 2026 ungeklärt; die allgemeine Position ist, dass menschlich verfasste Elemente schützbar sein können, während rohe KI-Ausgaben es nicht sind. Die Verwendung eines Uncensored-Modells ändert diese Analyse nicht.

Muss ich bei der Nutzung von Hermes 3 / Dolphin für kreatives Schreiben die DSGVO beachten?

Für rein lokale Generierung auf deinem eigenen Gerät ist die DSGVO-Relevanz minimal: keine personenbezogenen Daten werden an externe Auftragsverarbeiter übermittelt, da das Modell vollständig lokal läuft. Relevant wird die DSGVO, wenn deine Belletristik reale identifizierbare Personen verwendet oder wenn du KI-generierte Inhalte auf Plattformen veröffentlichst, die personenbezogene Daten verarbeiten. In diesem Fall gelten die üblichen Datenschutzpflichten — nicht aufgrund des Modells, sondern aufgrund der Verarbeitung und Veröffentlichung.

Welche deutschen Gesetze gelten beim Schreiben von Dark Fiction mit lokalen KI-Modellen?

Drei Gesetze sind besonders relevant: §184b StGB (Kinderpornografie) — absolutes Verbot, gilt auch für KI-generierte Inhalte und fiktionale Rahmungen; §130 StGB (Volksverhetzung) — gilt für Inhalte, die zum Hass gegen Bevölkerungsgruppen aufstacheln; §3 KUG schützt das Recht am eigenen Bild realer Personen. „Lokal generiert" oder „Fiktion" ist in keinem dieser Fälle eine Verteidigung. Für Belletristik, die keine realen Personen, keine Minderjährigen in sexuellen Kontexten und keine Aufstachelung enthält, ist lokale Generierung rechtlich vergleichbar mit dem Schreiben mit jedem anderen Werkzeug.

← Zurück zu Lokale LLMs Pro