Qwen3-7B 能处理长篇中文角色扮演吗？

可以。Ollama 中 Qwen3-7B Q4_K_M 默认支持 32K 上下文。长篇对话可在 SillyTavern API 设置中增大上下文窗口，10K+ token 的一致性建议升级到 Qwen3-14B 或更高。

SillyTavern 支持中文角色名和描述吗？

支持。SillyTavern 将所有角色数据存储为 UTF-8 JSON，姓名、描述、开场白、示例对话均可用中文书写。界面无需插件即可正确显示中文字符。

为什么模型输出中英文混杂？

系统提示词缺少语言指令。在系统提示词中添加：始终用简体中文回复，不要使用英文。同时确认使用的是中文训练模型（Qwen3、Yi、ChatGLM），而非 Llama 或 Mistral——后者默认输出英文。

能用繁体中文吗？

可以。将系统提示词中的简体中文替换为繁體中文。Qwen3 对繁体中文支持良好。Yi-34B 也支持繁体中文，但一致性略低于简体。ChatGLM3 主要在简体中文上训练，不推荐用于繁体中文场景。

在 Mac 上能用吗？

可以。Apple Silicon 上的 Ollama 通过 Metal 后端运行 Qwen3-7B 和 14B。Qwen3-72B 需要至少 64 GB 统一内存（Mac Studio M2 Ultra/M3 Ultra 或 Mac Pro）。运行 `ollama pull qwen2.5:72b`，SillyTavern 连接方式相同。

模型中文角色扮演效果怎么评估？

重点看三点：(1) 是否坚持用中文回复而不夹杂英文；(2) 是否保持角色一致性，不出现 OOC（出戏）；(3) 用词是否符合设定语境（古风/现代/科幻）。Qwen3-72B 在这三点上综合表现最佳，Yi-34B 在情感表达上有优势。

SillyTavern 中文角色扮演配置指南

选择语言:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

快速回答

Qwen3-72B Q4_K_M 是中文角色扮演的最佳本地模型——原生中文训练、词汇丰富、支持 128K 上下文。Yi-34B 擅长角色情感深度。8GB 显存推荐 Qwen3-7B，速度 8–12 token/秒。

▸Qwen3-72B Q4_K_M：46 GB 内存，最佳中文散文质量，128K 上下文——适合工作站或 Mac Studio
▸Yi-34B Q4_K_M：21 GB 内存，出色的角色声音与情感层次
▸Qwen3-7B Q4_K_M：5.5 GB 显存，8–12 token/秒——8GB 显卡首选
▸ChatGLM3-6B：4.5 GB 显存，推理最快但角色一致性较弱

更新于: 2026-05

Model Comparisons中级

关键要点

✓Qwen3-72B Q4_K_M：最佳中文散文，需要 46 GB 内存
✓Yi-34B Q4_K_M：最佳角色深度，21 GB 内存
✓Qwen3-7B Q4_K_M：8GB 显存首选，8–12 token/秒
✓SillyTavern → API 类型：OpenAI 兼容 → URL：http://127.0.0.1:11434/v1
✓角色卡：直接粘贴中文文本，保存为 UTF-8
✓系统提示词：始终用简体中文回复。保持角色一致性。

中文角色扮演选哪个 Qwen 或中文模型

四款模型覆盖主要硬件档次。Qwen3-72B 散文质量最高，但需要配备 46 GB 统一内存的工作站或 Mac Studio。Yi-34B 适合重视角色声音和情感层次的用户。Qwen3-7B 是标准游戏显卡的实用之选。

4 步将 SillyTavern 连接到 Ollama

SillyTavern 通过 OpenAI 兼容 API 端点与 Ollama 通信。无需插件——Ollama 原生在 11434 端口暴露此接口。

中文角色卡设置

SillyTavern 的角色卡（人设描述、开场白、示例对话）完全支持中文文本。系统语言为 UTF-8 时，直接用简体中文书写即可，无需额外编码步骤。

名字：苏云
描述：苏云是一名二十五岁的古风侠女，性格冷静、话语简洁，行事果断。她来自江湖，精通剑术，内心深处渴望平静的生活。
开场白：（苏云缓缓抬头，眸色沉静）你来了。有什么事？
示例对话：
{{user}}: 我需要你的帮助。
苏云: 先说清楚，值不值得我出手。

防止乱码的编码设置

乱码几乎总是由以下三个原因之一造成：系统提示词缺少语言指令、模型未经中文训练，或终端/编辑器未设为 UTF-8。

▸**SillyTavern 配置：** 无需特殊设置——应用内部使用 UTF-8。导出/导入 JSON 格式角色卡时，确认编辑器以 UTF-8（非 ANSI 或 GB2312）保存。
▸**Windows 终端：** 启动 Ollama 前运行 `chcp 65001` 强制 UTF-8 代码页。
▸**Ollama 模型文件：** 使用自定义 Modelfile 时，设置 `PARAMETER stop ""`——某些基础模型的。！？等中文标点可能触发提前停止 token。
▸**llama.cpp 后端：** 添加 `--log-disable` 标志——默认日志输出在部分 Windows 终端中可能破坏 Unicode。

中文角色扮演系统提示词模板

将以下内容填入 SillyTavern 的系统提示词字段（API → 指令模板）。根据需要调整角色名和语气风格。

你是{{char}}。请始终用简体中文回复，保持角色一致性。
规则：
- 不要破坏角色（OOC）
- 回复长度：100–300字，根据情境调整
- 使用符合古风/现代/科幻（选择一种）语境的词汇
- 如有动作描写，用括号标注，如：（她轻轻叹气）