SillyTavern 中文角色扮演配置指南
快速回答
Qwen2.5-72B Q4_K_M 是中文角色扮演的最佳本地模型——原生中文训练、词汇丰富、支持 128K 上下文。Yi-34B 擅长角色情感深度。8GB 显存推荐 Qwen2.5-7B,速度 8–12 token/秒。
- ▸Qwen2.5-72B Q4_K_M:46 GB 内存,最佳中文散文质量,128K 上下文——适合工作站或 Mac Studio
- ▸Yi-34B Q4_K_M:21 GB 内存,出色的角色声音与情感层次
- ▸Qwen2.5-7B Q4_K_M:5.5 GB 显存,8–12 token/秒——8GB 显卡首选
- ▸ChatGLM3-6B:4.5 GB 显存,推理最快但角色一致性较弱
更新于: 2026-05
Model Comparisons中级
关键要点
- ✓Qwen2.5-72B Q4_K_M:最佳中文散文,需要 46 GB 内存
- ✓Yi-34B Q4_K_M:最佳角色深度,21 GB 内存
- ✓Qwen2.5-7B Q4_K_M:8GB 显存首选,8–12 token/秒
- ✓SillyTavern → API 类型:OpenAI 兼容 → URL:http://127.0.0.1:11434/v1
- ✓角色卡:直接粘贴中文文本,保存为 UTF-8
- ✓系统提示词:始终用简体中文回复。保持角色一致性。
中文角色扮演选哪个 Qwen 或中文模型
四款模型覆盖主要硬件档次。Qwen2.5-72B 散文质量最高,但需要配备 46 GB 统一内存的工作站或 Mac Studio。Yi-34B 适合重视角色声音和情感层次的用户。Qwen2.5-7B 是标准游戏显卡的实用之选。
4 步将 SillyTavern 连接到 Ollama
SillyTavern 通过 OpenAI 兼容 API 端点与 Ollama 通信。无需插件——Ollama 原生在 11434 端口暴露此接口。
中文角色卡设置
SillyTavern 的角色卡(人设描述、开场白、示例对话)完全支持中文文本。系统语言为 UTF-8 时,直接用简体中文书写即可,无需额外编码步骤。
名字:苏云
描述:苏云是一名二十五岁的古风侠女,性格冷静、话语简洁,行事果断。她来自江湖,精通剑术,内心深处渴望平静的生活。
开场白:(苏云缓缓抬头,眸色沉静)你来了。有什么事?
示例对话:
{{user}}: 我需要你的帮助。
苏云: 先说清楚,值不值得我出手。防止乱码的编码设置
乱码几乎总是由以下三个原因之一造成:系统提示词缺少语言指令、模型未经中文训练,或终端/编辑器未设为 UTF-8。
- ▸**SillyTavern 配置:** 无需特殊设置——应用内部使用 UTF-8。导出/导入 JSON 格式角色卡时,确认编辑器以 UTF-8(非 ANSI 或 GB2312)保存。
- ▸**Windows 终端:** 启动 Ollama 前运行 `chcp 65001` 强制 UTF-8 代码页。
- ▸**Ollama 模型文件:** 使用自定义 Modelfile 时,设置 `PARAMETER stop ""`——某些基础模型的。!?等中文标点可能触发提前停止 token。
- ▸**llama.cpp 后端:** 添加 `--log-disable` 标志——默认日志输出在部分 Windows 终端中可能破坏 Unicode。
中文角色扮演系统提示词模板
将以下内容填入 SillyTavern 的系统提示词字段(API → 指令模板)。根据需要调整角色名和语气风格。
你是{{char}}。请始终用简体中文回复,保持角色一致性。
规则:
- 不要破坏角色(OOC)
- 回复长度:100–300字,根据情境调整
- 使用符合古风/现代/科幻(选择一种)语境的词汇
- 如有动作描写,用括号标注,如:(她轻轻叹气)常见问题
想了解完整详情?
阅读完整指南 →