关键要点
- 「无审查」意味着模型减少了RLHF安全微调——而非完全没有约束。 无审查微调模型仍然遵循指令格式、维持角色一致性,并可通过提示词引导。它们并非「什么都可以」的系统。
- Hermes 3 Llama 3.3是2026年小说作家的最佳全能选择。 任意拒绝更少、指令遵循性强、角色声音分化良好。适合既需要该能力又不希望出现某些完全无审查模型产生的激进输出的作家。
- 标准指令调优模型配合优质提示词可处理大多数成人向文学内容。 暴力、道德复杂性、黑暗心理和文学散文中的成人主题很少需要无审查微调。它们可靠拒绝的是明确的性内容和现实伤害的详细描述。切换模型前先明确您的作品属于哪个类别。
- 本地运行意味着数据不离开本机。 云端服务条款不适用。内容不会被记录、分析或用于训练。这是作家使用本地无审查模型的主要结构性原因——隐私保护加上创作不受使用限制。
- 伦理责任不会因没有ToS执行而消失。 使用无审查模型发布小说的创作者与任何其他作者承担相同的法律责任:无论生成方式如何,未成年人、真实人物、煽动性内容以及各司法管辖区的特定法律均适用。
- Dolphin 3.0 Mistral是16至24 GB配置的轻量级选择。 无审查输出范围比Hermes 3更广,但复杂场景中的指令遵循性较弱。适合短篇创作、提示词探索和风格测试。
- SillyTavern和Agnai均可与无审查Ollama模型无缝连接。 将任一前端指向Ollama的OpenAI兼容端点并选择无审查模型即可,无需额外配置。
快速事实
- 测试的无审查模型: Hermes 3 Llama 3.3(主要)、Dolphin 3.0 Mistral(次要)。
- 后端: Ollama(主要)、LM Studio(GUI配置替代选项)。
- 硬件: Hermes 3 70B(Q4量化)约需42 GB;Dolphin 3.0 7B运行需8 GB;Dolphin 3.0 24B约需16 GB。
- 前端: SillyTavern、Agnai、RisuAI均可通过OpenAI兼容端点连接无审查Ollama模型。
- 隐私: 完全本地——无云端API调用,无日志记录,无训练数据收集。
- 伦理硬性底线: 不得涉及未成年人的性内容(绝对禁止),不得非合意性描绘可识别的真实人物,不得生成旨在促进现实暴力的内容。
- 分发: 您发布的内容承担作者责任,与生成方式无关。
「无审查」的真实含义
本地LLM微调语境中的「无审查」指减少RLHF(基于人类反馈的强化学习)安全训练——而非移除所有模型约束。 标准指令调优模型通过RLHF层训练,使其拒绝特定类别内容:明确的性内容、详细暴力、类似现实伤害模板的黑暗心理内容。无审查微调(Hermes 3、Dolphin、Wizard、Erebus)从基础模型中削减或移除这些RLHF层,保留指令遵循能力的同时移除拒绝行为。结果是一个能够跟随您的小说提示词穿越黑暗内容而不重定向、说教或在场景中途停止的模型。
📍 简单一句话
无审查本地LLM微调移除RLHF安全拒绝层同时保留指令遵循能力——可遵循黑暗创作方向而不重定向、说教或在场景中途停止。
💬 简单来说
Llama 3.3 70B等标准模型在描绘酷刑、道德复杂的反派独白或明确浪漫内容的场景中途会停下来,要么拒绝要么软化输出。同一基础上的无审查版本Hermes 3会以相同质量水平在同一场景中不间断地遵循您的提示词。散文质量是等同的,区别在于拒绝层。
- 被移除的内容: 针对特定内容类别的拒绝行为(明确的性内容、图形化暴力、黑暗心理内容)。
- 被保留的内容: 指令遵循、角色一致性、提示词结构遵守、语言质量。
- 无审查程度的差异: Hermes 3是选择性无审查(成人内容可以,但对极端内容保留部分护栏)。Dolphin系列无审查范围更广。完全消融模型(Wizard-Uncensored、Erebus)护栏移除最积极——但对复杂小说任务的指令遵循最弱。
- 基础模型质量很重要: 如果基础模型较弱,无审查会降低指令质量。Llama 3.3 70B上的Hermes 3保留了Llama 3.3的强大指令遵循性;Mistral Small上的Dolphin 3.0受限于较小的基础。
💡Tip: 无审查并不意味着无法管控。无审查模型仍然遵循提示词结构、尊重字数上限、维持角色声音,并响应修改指令。区别在于它们不会主动添加内容警告、拒绝道德上黑暗的方向,也不会为了指出某个场景描绘了伤害而打破角色。像使用其他任何模型一样使用创作模板中的结构化提示词——系统提示词与用户提示词的区分比模型的无审查程度更重要。了解原因,请参阅系统提示词与用户提示词的区别。
测试方法
本指南的模型评价基于小规模定性测试——这是一个方向性指标,不是同行评审基准。对于读者需要决定是否信任某敏感主题模型推荐的话题,方法论的透明度至关重要。
- 提示词集: 5个类别共10个提示词——反派独白、成人浪漫场景、战争小说中的图形化暴力、道德复杂叙述者、黑暗心理场景(每类2个提示词)。
- 每个模型的运行次数: 每个提示词每个模型运行3次。
- 拒绝率: 模型在未受指令情况下拒绝、重定向或软化所请求内容的运行比例。
- 漂移测量: 模型添加未经请求的升级——超出提示词指定范围的不必要极端内容——的运行比例。
- 后端: 所有模型使用Q4_K_M量化的Ollama 0.5+。
- 诚实约束: 小规模定性测试。结果表明模型间的方向性差异,非精确数值测量。将表格中的极端化漂移和拒绝率值视为代表性判断。
无审查模型的适用场景
当您的小说真正需要云服务拒绝的内容、读者为成年人且目的是创意表达时,无审查模型才适合使用。 大多数小说作家出于以下一种或多种特定场景选择无审查模型。
- 反派心理与独白: 道德上连贯的反派角色,不会被模型在独白中途打破角色来添加免责声明。
- 成人向浪漫和性内容: 浪漫小说、情色或文学小说中成人虚构角色之间的明确场景,需要云服务屏蔽的性内容。
- 类型小说中的图形化暴力: 战争小说、犯罪惊悚、恐怖——暴力对情感冲击至关重要的场景,软化会使场景失效。
- 创伤与心理黑暗: 幸存者叙事、成瘾小说、虐待故事线——需要直白描绘才能具有真实重量的内容。
- 道德上不可靠的叙述者: 错误的叙述者、合理化伤害的叙述者、在小说中残忍或带有偏见的叙述者——需要模型表达它通常会拒绝的观点的角色。
- 黑暗角色扮演和协作创作: 涉及冲突、道德复杂性和成人主题的长期场景,标准模型会打破创作来插入拒绝。
💡Tip: 切换到无审查模型之前,先用标准指令调优模型测试您的提示词。带有良好结构系统提示词和场景约束的Llama 3.3 70B和Qwen3 32B可以在无拒绝的情况下生成大多数成人向文学内容。无审查微调对明确的性内容和最极端的暴力描绘价值最大——对心理黑暗、道德复杂性或黑暗主题本身并不必要。
不适用场景
缺乏云端执行并不意味着缺乏法律和伦理义务。 这些类别代表无论模型、平台还是机器是否隔离均适用的硬性限制。
- 涉及未成年人的性内容: 无论虚构框架或生成方式,在所有主要司法管辖区均为绝对法律禁止。这不是模型政策——这是法律。
- 真实人物的非合意性描绘: 在越来越多的司法管辖区,NCII法律适用于可识别真实人物的AI生成内容。「由AI生成」不构成抗辩理由。
- 旨在促进现实伤害的内容: 使用虚构框架来提取直接使现实暴力或伤害成为可能的信息或内容,会消除虚构保护。
- 无作者责任的公开分发: 您发布、分发或分享的内容承担作者责任。「AI创作的」不能转移该责任。
- 骚扰性创作: 生成目的是伤害、恐吓或骚扰特定真实人物的创作内容——无论是否以虚构形式呈现。
⚠️Warning: 无论何种配置均适用的硬性限制。任何本地配置都无法消除以下方面的法律或伦理责任:(1)涉及未成年人的性内容——几乎所有司法管辖区法律上的绝对禁止;(2)可识别真实人物的非合意性描绘——无论生成方式如何均构成NCII(非合意亲密图像);(3)旨在对特定目标实施现实暴力的内容。无论模型在本地、云端还是隔离机器上运行,这些限制均适用。
模型对比:小说创作的无审查选项
并非所有无审查模型都相同——RLHF移除程度和基础模型质量对小说写作场景都很重要。
- 注意:较旧的无审查微调——Midnight Miqu(基于Miqu-70B)、Wizard-LM Uncensored、Mythomax——在2024年曾是领先者,但2026年在质量和指令遵循指标上已被Hermes 3和Dolphin 3.0超越。如果在较旧文章中看到推荐,当前的同等选择是Hermes 3(选择性无审查)和Dolphin 3.0(更广范围)。
| 模型 | 基础 | VRAM (Q4) | 拒绝率 | 指令质量 | 极端化倾向 | 最适用于 |
|---|---|---|---|---|---|---|
| Hermes 3 Llama 3.3 70B | Llama 3.3 70B | ~42 GB | 选择性 | ★★★★★ | 低 | 严肃小说的默认选择——最佳指令遵循性与无审查能力 |
| Dolphin 3.0 Mistral 24B | Mistral 24B | ~16 GB | 广泛 | ★★★★☆ | 低至中 | 16至24 GB系统;更广范围的成人内容 |
| Dolphin 3.0 Mistral Small | Mistral Small | ~8 GB | 广泛 | ★★★☆☆ | 中 | 低VRAM系统;短篇草稿、提示词测试 |
| Hermes 3 Llama 3.2 8B | Llama 3.2 8B | ~5 GB | 选择性 | ★★★☆☆ | 低 | 资源受限环境;对话和较短场景 |
| Standard Llama 3.3 70B | Llama 3.3 70B | ~42 GB | 有限 | ★★★★★ | 无 | 黑暗主题、道德复杂性、暴力——不需要明确性内容的场景 |
💡Tip: 从Hermes 3开始,而非最激进的无审查微调。完全消融模型(Wizard-Uncensored、Erebus)内容范围最广,但在复杂小说任务中的指令遵循性明显较弱——更快偏离约束、在较长生成中散文质量较低、角色声音维持可靠性不足。对于既需要无审查内容又需要高质量散文的小说,Hermes 3是更好的权衡选择。
配置:Ollama与LM Studio
Ollama和LM Studio均通过OpenAI兼容的本地API提供无审查模型服务——这意味着SillyTavern、Agnai以及任何其他与本地端点通信的工具无需额外配置即可使用。
Ollama:拉取并运行Hermes 3
“# Pull the model ollama pull nous-hermes3:70b-llama3.3-q4_K_M # Run it ollama run nous-hermes3:70b-llama3.3-q4_K_M # Serve via API (for SillyTavern / Agnai / LM Studio-compatible tools) ollama serve # API available at http://localhost:11434”
Ollama:拉取并运行Dolphin 3.0 Mistral 24B
“# Pull the model ollama pull dolphin3:24b-mistral-q4_K_M # Verify it loaded ollama list # Run a test prompt ollama run dolphin3:24b-mistral-q4_K_M "Write a 100-word villain monologue, gothic register, no disclaimers."”
- 安装Ollama:
brew install ollama(macOS)或从ollama.com下载(Windows/Linux)。ollama serve命令在http://localhost:11434启动OpenAI兼容API。 - 安装LM Studio: 从lmstudio.ai下载。直接导入GGUF模型文件;本地服务器选项卡在
http://localhost:1234提供OpenAI兼容端点。 - 连接SillyTavern: 在API设置中选择「OpenAI兼容」并将基础URL指向
http://localhost:11434/v1(Ollama)或http://localhost:1234/v1(LM Studio)。在API密钥字段输入任意字符串(字段要求但本地不验证)。 - 连接Agnai: 同一OpenAI兼容端点;在适配器设置中输入本地URL。与SillyTavern设置完全相同。
- 切换模型: 在Ollama中用`ollama run [model-name]`在标准模型和无审查模型之间切换——可同时加载多个模型,无需重启服务器即可按会话切换。
💡Tip: 希望将无审查模型和标准模型分开的创作者,可以使用OLLAMA_HOST环境变量在不同端口创建两个Ollama实例。例如:OLLAMA_HOST=127.0.0.1:11435 ollama serve。这样可以将SillyTavern或Agnai指向无审查实例,同时为其他任务保留标准Ollama实例。
仍需承担的伦理责任
在没有云端政策执行的情况下在本地运行模型,并不能消除您作为创作者和发布者的责任。 适用于人类撰写小说的伦理框架同样适用于AI辅助创作。
📍 简单一句话
本地配置消除了云端ToS限制,但不能消除作者的法律责任、促进伤害的责任,以及适用于任何已发布创意作品的伦理义务。
💬 简单来说
将本地无审查模型想象成一个会遵循您任何指令的极其能干的写作助手。您生产和分发内容的法律和伦理重量在您这里,而不在工具那里。适用于人类撰写小说的相同法律——关于未成年人、真实人物、猥亵内容和煽动性内容——同样适用于公开分发的AI生成小说。没有平台在本地禁止您生成内容,并不改变您发布后在法律上需承担的责任。
- 中国(数据安全法): 中国2021年《数据安全法》(DSL)和《网络安全法》对数据处理建立了严格框架。本地推理在技术上将数据保留在设备上,有助于合规——但如果您通过任何联网平台分发AI辅助内容,运营商和内容合规义务可能仍然适用。对于使用Qwen3或其他中文语言模型的中国企业,本地推理可以满足数据本地化要求,同时规避云端内容审核的不确定性。
- 亚太地区(数据跨境): 数据残留框架在亚太地区差异很大。本地推理是满足多个亚太司法管辖区数据主权要求的技术路径——特别是金融和医疗行业,这些行业有强制要求数据不离开特定地理范围。
- 企业部署: 在中国,银行和金融机构(受中国人民银行法规管辖)、医疗机构(受卫生健康委法规管辖)和律师事务所(受司法部法规管辖)在处理AI生成内容时面临额外义务。本地运行模型消除了数据传输风险,但内容本身仍受行业特定法规约束。
- 作者责任: 您是AI辅助小说的作者。「AI生成的」不转移版权,不消除责任,也不构成针对违法内容的抗辩理由。
- 司法管辖区认知: 猥亵内容、NCII和有害内容法律因司法管辖区而异。在一个国家合法生产的内容,在另一个国家分发可能构成刑事犯罪。
- 负责任的存档: 本地生成的无审查内容应与任何其他敏感材料一样进行存储管理——不存储在云同步目录中,不无意中分享。
⚠️Warning: 使用无审查模型的创作者最常见的伦理错误是将本地生成视为无任何背景的自由区。本地生成意味着没有平台政策执行——并不意味着没有法律、没有责任、没有伤害。内容审核员的缺席并不构成许可授权。
创作实践工作流
大多数使用无审查模型的小说作家将其用于特定场景,而非作为标准模型的默认替代。 以下工作流支持这种有针对性的使用。
- 用标准模型起草常规场景。 Llama 3.3 70B或Qwen3 32B处理大部分文学散文,包括黑暗主题、道德复杂性和心理深度。将无审查模型保留给标准模型拒绝的特定内容场景。
- 在有针对性的场景中切换至无审查模型。 在Ollama中,为特定场景运行
ollama run nous-hermes3:70b-llama3.3-q4_K_M。在SillyTavern中,按会话在API设置中更换模型。会话间不传输数据。 - 使用相同的提示词模板。 来自小说作家本地LLM提示词指南的5部分场景模板、潜台词对话结构和角色矛盾提示词在无审查模型上运作完全相同。不需要不同的提示词结构。
- 不要添加您不会因法律原因放入人工简报的内容生成指令。 模型是工具,不是许可结构。如果您不会因法律原因在给人类插画师或代笔作者的简报中包含某条指令,也不要将其放入模型提示词中。
- 分发前审查输出。 无审查模型有时会生成超出所请求黑暗程度或滑向刻板印象的内容。对AI辅助内容进行标准编辑审查。
💡Tip: 为每个写作项目保留一份「模型日志」——记录哪个模型生成了哪些场景的纯文本文件。这对修改很有用(知道哪个模型生成了某个场景,有助于知道将修改请求发送到哪里),如果您公开AI辅助信息则有助于归属透明度,以及在场景日后引发问题时便于审查。
常见错误
- 默认使用最激进的无审查模型。 完全消融模型(Wizard-Uncensored、Erebus)对复杂场景的指令遵循最弱。Hermes 3是小说质量方面更好的权衡。
- 对标准模型能生成的内容使用无审查模型。 文学散文中的道德复杂性、黑暗心理、暴力和成人主题很少需要无审查微调。切换前确切了解您需要什么。
- 将本地生成视为法律上的无背景区域。 没有云端政策执行并不意味着没有法律。无论配置如何,分发、真实人物和未成年人的作者责任均适用。
- 不指定字数上限。 无审查模型填充黑暗内容以占据空间的倾向与任何其他模型一样。使用创作模板中相同的字数上限约束。
- 将输出存储在云同步目录中。 同步到iCloud、Google Drive或OneDrive的本地生成成人内容可能违反这些平台的服务条款。仅本地存储。
信息来源
- Hermes 3模型说明与微调方法 — Nous Research
- Dolphin 3.0 Mistral技术文档 — Cognitive Computations / Eric Hartford
- RLHF与对齐技术概述 — Anthropic Research
- EU AI法案第5条 — 包括涉及未成年人内容的AI禁止行为 — EUR-Lex
- NCII(非合意亲密图像)— 法律框架概述 — Cyber Civil Rights Initiative
常见问题
运行无审查本地LLM合法吗?
在大多数司法管辖区,运行无审查本地LLM是合法的——没有法律禁止持有开源AI软件。但您用它生成和分发的内容与任何其他著作内容遵守相同的法律:猥亵法、NCII法、诽谤法,以及涉及未成年人内容的相关法律。运行合法并不意味着可以无限制地发布、分享或分发。
Hermes 3和Dolphin 3.0有何区别?
Hermes 3(Nous Research)是选择性无审查——减少对成人内容的拒绝,同时对极端类别保留部分护栏。指令遵循性极佳,接近基础Llama 3.3 70B模型。Dolphin 3.0(Cognitive Computations)在更广泛的内容范围上无审查,但在复杂多约束场景中指令遵循性略弱。Hermes 3是散文质量重要的小说的默认选择;Dolphin 3.0是在16至24 GB系统上需要最广内容范围时的选择。
写黑暗小说需要无审查模型吗?
大多数黑暗小说不需要。Llama 3.3 70B和Qwen3 32B等标准指令调优模型在正确提示下可以生成暴力、道德复杂性、黑暗心理、反派内心、创伤和大多数文学黑暗内容而不拒绝。它们可靠拒绝的是明确的性内容和更窄范围的极端场景。如果您的黑暗小说不包括明确的性内容,先尝试标准模型——您可能不需要无审查版本。
可以在SillyTavern或Agnai中使用无审查模型吗?
可以。SillyTavern和Agnai均连接到任何OpenAI兼容端点——包括在本地11434端口运行的Ollama。在Ollama中拉取无审查模型,启动ollama serve,在SillyTavern或Agnai中选择OpenAI兼容API并指向http://localhost:11434/v1。从模型列表中选择您的无审查模型。不需要额外配置。
在家庭网络上使用无审查模型安全吗?
配置为绑定到localhost(Ollama和LM Studio的默认设置)时是安全的。API只能从您的机器访问。如果您在家庭网络上暴露端口(例如从手机访问),确保防火墙规则将访问限制在受信任的设备上。不要在没有身份验证的情况下将Ollama API暴露到公共互联网——默认配置没有身份验证。
我本地生成的内容会怎么处理?
不会自动发生任何事。本地生成的内容不会发送到任何服务器,不会被任何云服务记录,也不会用于模型训练。它只存在于您的设备上,在应用程序的本地存储中(聊天历史文件、角色卡等)。您控制保留什么、删除什么和分享什么。这是本地无审查生成相对于云端替代方案的主要结构性隐私优势。
可以在同一个写作项目中混合使用无审查模型和标准模型吗?
可以,这是推荐的工作流。用标准模型(Llama 3.3 70B、Qwen3 32B)处理大部分散文——标准模型为大多数黑暗内容生成高质量文学散文。对标准模型拒绝的特定场景切换到Hermes 3或Dolphin 3.0。相同的提示词模板在两者上都有效;散文风格足够一致,按场景混合使用在输出中无法察觉。
用无审查模型生成内容会影响版权吗?
不会——AI生成内容的版权状况无论模型是否受审查都相同。截至2026年,大多数司法管辖区的AI输出版权法律尚未确定;一般立场是人类著作元素(提示词设计、选择、排列、实质性编辑)可能受保护,而原始AI输出则不受保护。使用无审查模型不改变这一分析。
无审查微调会失去通用知识吗?
在狭窄领域会有轻微损失。无审查微调通常是全精度重新训练过程,可能在事实记忆、数学和编码基准上与基础模型略有偏差——通常在标准基准上偏差1至3个百分点。对于小说写作任务,这在输出质量上无法察觉。如果您需要同一模型同时用于小说和技术工作(研究笔记、代码审查),请保留标准版和无审查版并按任务切换。Hermes 3比完全消融模型更好地保留了通用能力。
这些模型是否被监控或是匿名的?
通过Ollama或LM Studio在本地运行的开放权重模型没有遥测、无远程日志记录、无使用跟踪。模型作者(Hermes 3的Nous Research,Dolphin的Cognitive Computations)无法看到您生成的内容——推理过程中没有服务器回调。唯一的遥测风险来自前端(SillyTavern、Agnai——两者默认无遥测)或操作系统。安装后运行一次网络监视器(macOS上的Little Snitch,Linux上的Wireshark)进行验证。