PromptQuorumPromptQuorum
Home/Blog/AIコンセンサススコアリング耇数モデルにわたるハルシネヌションの怜出方法
AI信頌性

AIコンセンサススコアリング耇数モデルにわたるハルシネヌションの怜出方法

5぀のAIモデルが独立しおある事実に同意する堎合、1぀のモデルが単独で答える堎合よりも回答の信頌性が倧幅に高くなりたす。これがAIコンセンサススコアリングの原理です。

•11分の読み物•By Hans Kuepper · PromptQuorum

AIコンセンサススコアリングずは

AIコンセンサススコアリングは、耇数の独立した蚀語モデル間の䞀臎床を枬定するこずで、AIが生成した情報の信頌性を評䟡する方法です。同じプロンプトを5぀以䞊のAIモデルに送信し、回答が収束する箇所ず分岐する箇所を分析するこずで、どの䞻匵が正確でどれが朜圚的にハルシネヌトされおいるかに぀いおの統蚈的シグナルが埗られたす。

コンセンサススコアリングは、同意したモデルの数に基づいお各䞻匵に信頌床レベルを割り圓おたす。高いコンセンサス高い信頌性。䜎いコンセンサスさらに調査が必芁。

単䞀モデルの回答が重芁な意思決定に信頌できない理由

すべおの䞻芁な蚀語モデルはハルシネヌトしたす。GPT-4o、Claude、Gemini — どれも自信ありげな蚀語で事実を捏造したす。モデル間の違いは、ハルシネヌトするかどうかではなく、どの事実を間違えるか、そしおい぀かです。

  • •ハルシネヌション率は、よく文曞化された領域で3〜7%から、ニッチなトピックや最近の出来事で20〜30%たで倉動したす
  • •同じむンタヌネットデヌタでトレヌニングされたモデルは、䞀郚のハルシネヌションパタヌンを共有したすが、各モデルは独自の倱敗パタヌンも持っおいたす
  • •GPT-4oがハルシネヌトした䞻匵が、たったく同じ方法でClaudeによっお独立しおハルシネヌトされる可胜性は䜎い

コンセンサススコアリングの仕組み

コンセンサススコアリングは4぀のステヌゞで機胜したす

  • •ステヌゞ1 — 送信同䞀の最適化されたプロンプトを耇数のAIモデルに同時送信
  • •ステヌゞ2 — 収集すべおの回答をフィルタリングせずに収集
  • •ステヌゞ3 — 抜出各回答を個別の怜蚌可胜な䞻匵に分解
  • •ステヌゞ4 — スコアリング各䞻匵に぀いお、独立しお述べたモデルの数をカりント

コンセンサス信頌床レベル

PromptQuorumはコンセンサススコアを5぀の信頌床レベルにマッピングしたす

レベル合意解釈アクション
完党なコンセンサス5/5モデルほが確実な事実䞻匵高い信頌床で受け入れる
匷いコンセンサス4/5モデル非垞に信頌性が高い受け入れ、divergingモデルを蚘録
倚数コンセンサス3/5モデルおそらく正確、䞀郚䞍確実怜蚌メモ付きで受け入れ
匱いコンセンサス2/5モデル争いのある、たたは曖昧な䞻匵独立しお確認
コンセンサスなし1/5モデル朜圚的ハルシネヌション手動ファクトチェックのためフラグ

クロスモデル分析によるハルシネヌション怜出

AIモデルは独立しおハルシネヌトしたす。各モデルは独自のトレヌニングデヌタ分垃ず独自の倱敗モヌドを持っおいたす。特定の誀った䞻匵が5぀の異なるモデルによっお独立しお生成される可胜性は統蚈的にほがれロです。

  • •数倀ハルシネヌション誀った日付、統蚈は最も怜出しやすい
  • •固有名詞ハルシネヌションは、モデルが垰属に぀いお䞀臎しない堎合に怜出される
  • •関係ハルシネヌションは、モデルが互いに矛盟する堎合に明らかになる

実際の䟋コンセンサススコアリングの実践

5぀のモデルに「2024幎のOpenAIの時䟡総額は」ず質問したずしたす。

4぀のモデルは800億ドル2024幎10月の資金調達ラりンドで䞀臎。1぀のモデルは1,570億ドルず述べたす。コンセンサススコアリングは即座に䞍䞀臎を明らかにしたす。

PromptQuorumの13のQuorum分析タむプ

PromptQuorumは13の異なる分析タむプでコンセンサススコアリングを実装したす

  • •コンセンサスサマリヌ — すべおのモデルが同意する䞻匵を抜出
  • •加重マヌゞ — 信頌スコアで重み付けされたベストオブオヌル回答を合成
  • •アトミックファクト抜出 — 回答を個別の怜蚌可胜な䞻匵に分解
  • •オヌバヌラップマッピング — 最倚回答に登堎するコンテンツを特定
  • •矛盟怜出 — モデルが盎接矛盟するポむントをフラグ
  • •信頌スコアリング — クロスモデル合意に基づく各䞻匵のスコア
  • •完党性チェック — 䞀郚のモデルに存圚するが他に欠けおいる情報を特定
  • •ハルシネヌション怜出 — 1〜2モデルにのみ登堎する䞻匵をフラグ
  • •冗長性排陀 — 繰り返し情報を削陀
  • •ベスト回答遞択 — 最も完党で正確なモデル回答を特定
  • •マルチモデルアンサンブル — 各モデルの最良芁玠を組み合わせたハむブリッド回答
  • •論争フラグ — モデルが䞀貫しお意芋が分かれるトピックをマヌク
  • •回答ランキング — 最も信頌できるものから最も信頌できないものぞの順䜍付け

コンセンサススコアリングが最も重芁な堎面

  • •リサヌチずファクトチェック — 䞀぀のハルシネヌトされた統蚈が議論党䜓を無効にしうる堎合
  • •医療・法的情報 — 正確さが亀枉䞍可胜な堎合
  • •最近の出来事 — モデルの知識カットオフに近いむベントのデヌタが少ない
  • •技術仕様 — バヌゞョン番号やAPI゚ンドポむントは頻繁に倉わる
  • •数倀䞻匵 — 日付、数字、パヌセンテヌゞは最も䞀般的なハルシネヌションベクタヌ

重芁なポむント

  • •AIコンセンサススコアリングは独立したモデルの合意を比范するこずで信頌性を枬定する
  • •どの単䞀AIモデルもハルシネヌションを排陀できない — クロスモデル怜蚌が唯䞀のスケヌラブルな信頌性レむダヌ
  • •5/5モデルの䞻匵はほが確実1/5モデルの䞻匵はおそらくハルシネヌト
  • •ハルシネヌション怜出はモデルが独立しおハルシネヌトするため機胜する
  • •PromptQuorumは13のQuorum分析タむプでコンセンサススコアリングを実装

Ready to optimize your prompts?

← Back to Blog

AIコンセンサススコアリング耇数モデルにわたるハルシネヌションの怜出方法 | PromptQuorum Blog