哪个RAG平台处理最大的文档集？

PrivateGPT在消费者硬件上扩展最远。带有调整设置在32GB RAM机器上舒适地达到25,000页。AnythingLLM在10,000页左右破裂，Open WebUI在8,000页左右。超过25,000页，三个都不是正确的工具。

我可以在这些平台之间迁移文档和嵌入吗？

源文档自由迁移。所有三个接受相同的文件。嵌入不迁移。每个平台以自己的格式存储向量，因此切换总是意味着重新索引。

AnythingLLM。在50个评分查询中，对逐字引用查询正确引用了10个中的9个。

在5,047页语料库上使用默认嵌入器：AnythingLLM在6.2GB处达到峰值，Open WebUI 5.4GB，PrivateGPT 4.8GB。

AnythingLLM在GUI中支持8个嵌入后端。PrivateGPT通过settings.yaml支持任何HuggingFace模型。Open WebUI支持Ollama和OpenAI兼容端点。

PrivateGPT配对BAAI/bge-m3时最好。bge-m3支持100多种语言。

所有三个通过PDF解析器提取文本。表格被提取为文本。图形被提取为图像参考但未用于检索。

查询嵌入和搜索约500-700令牌等值计算。提示组装和回答生成取决于检索的块和模型的上下文窗口大小。

是的。对于更高规模：自定义Ollama + Qdrant / Weaviate。对于更简单的设置：Docling + Qdrant CLI。使用Llamaindex或LangChain直接构建自定义RAG管道。

AnythingLLM在工作空间元数据中记录。PrivateGPT可以启用FastAPI服务日志。Open WebUI记录用户登录和文档访问。

AnythingLLM、PrivateGPT和Open WebUI是2026年三个成熟的自托管RAG平台。我们将相同的5,047页语料库加载到每个平台，运行了50个跨5种查询类型的查询，测量了检索延迟、幻想率、引用质量和隐性成本（重新嵌入、向量DB存储、索引时GPU峰值）。演示冠军不是生产冠军。

关键要点

AnythingLLM在5,047页语料库上的幻想率最低（6%，vs PrivateGPT 11%，Open WebUI 14%），并生成了唯一具有文件名+页码参考的一致可引用答案。
PrivateGPT的检索延迟最低（p50 240ms，p95 720ms）和最干净的离线设计姿态。没有遥测SDK、云回退或隐藏的网络调用。
Open WebUI为共享部署提供了最好的操作人体工程学。多用户账户、OAuth、基于角色的文档访问、两次点击的Ollama集成。
所有三个平台在消费者硬件上8,000至12,000页之间降级。索引时间线性扩展，但当向量DB超过RAM时，检索召回率下降。
嵌入模型切换在所有三个平台上强制完全重新索引。在消费者硬件上，每5,000页预算30-90分钟。
磁盘上的向量DB存储是每1,000页40-120MB，取决于块大小和嵌入维度。50,000页语料库仅用于向量需要2-6GB。
对于将超过10,000页的库，考虑使用自定义Ollama + Qdrant或Weaviate堆栈。这三个平台的内置向量存储不是为该规模设计的。