PromptQuorum

什么是AI共识评分？PromptQuorum如何检测模型间的一致性

共识评分分析多个AI模型的回答，测量它们在哪里一致、在哪里分歧，以及这种模式对答案可靠性意味着什么。

发布于 2026年3月17日•6分钟阅读•By Hans Kuepper · PromptQuorum

信任单一AI模型的问题

每个大型语言模型都根据其训练数据、架构和推理参数生成输出。当前所有LLM都会产生幻觉——以与准确陈述相同的流畅度和自信度产生虚假陈述。

共识评分是一种可靠性测量技术，将同一查询发送给多个独立的AI模型，并分析其回答模式。当多个模型独立产生相同答案时，该答案更可能基于真实知识。