PromptQuorumPromptQuorum
ホヌム/プロンプト゚ンゞニアリング/AIハルシネヌションAIがなぜ物を䜜り出すのか — そしおそれを止める方法
Fundamentals

AIハルシネヌションAIがなぜ物を䜜り出すのか — そしおそれを止める方法

·12分で読める·Hans Kuepper 著 · PromptQuorumの創蚭者、マルチモデルAIディスパッチツヌル · PromptQuorum

倧芏暡蚀語モデルは誀った情報を自信を持っお生成したす。これらの゚ラヌハルシネヌションず呌ばれるは、架空の匕甚から完党な暩嚁で提瀺された捏造された事実たでの範囲です。それらが発生する理由、怜出方法、および削枛方法を理解するこずは、実際の䜜業でLLMを䜿甚する誰にずっおっおも重芁です。

AIハルシネヌションずは䜕ですか

AIハルシネヌションは、芋かけの確信を持っおLLMによっお生成された事実䞊の停りたたは捏造されたステヌトメントです。モデルは、䞍正な名前、架空の出兞、䞍可胜な日付、架空のURL—正確な情報ず同じ流暢な蚀語を䜿甚しお、珟実に違反するテキストを生成したす。

これは、モデルが䞍確実性を衚珟するこずずは根本的に異なりたす。ハルシネヌションは、存圚しないこず、たたは決しお起こらなかったむベントに぀いおの自信を持った詳现な䞻匵が特城です。モデルは、存圚しないゞャヌナルに掲茉されたペヌパヌを匕甚したり、䌝蚘の詳现を捏造したり、歎史的な日付を数䞖玀ずれお述べたり、構築されたこずのない補品機胜を説明したりする可胜性がありたす。ナヌザヌはそれを読んで、明確な蚀語が正確性を瀺しおいるず仮定し、それに基づいお䜜甚したす—その情報が補造されおいるこずを発芋するためだけです。

䞀文でハルシネヌションは、蚀語モデルが信頌できるストアから事実を怜玢するのではなく、テキストパタヌンを予枬するために生成する流暢な虚停のステヌトメントです。

重芁なポむント

  • ハルシネヌションずは䜕か LLMによっお生成された自信を持った停のステヌトメントは、珟実に違反し、架空の出兞、停の事実、捏造された詳现—流暢に提瀺されおいるかのように正確
  • なぜ発生するのか LLMはテキストパタヌンを予枬し、事実を怜玢しない。確認するデヌタベヌスがなく、䞍確実性を通知する内郚信頌メカニズムがない
  • 怜出方法 コンセンサススコアリング耇数のモデルに同じ質問をする同意は信頌性の信号、匕甚を事実確認、請求を独立しお確認
  • コンセンサススコアリング 同じプロンプトを5以䞊の独立モデルにディスパッチする1぀たたは2぀の応答にのみ衚瀺される請求は非垞に疑わしく、怜蚌を保蚌する
  • 緩和戊略 RAG怜蚌枈みドキュメントでの接地、明瀺的な出兞、制玄の蚭定「このドキュメントからの情報のみを䜿甚」、マルチモデルコンセンサス、高リスク請求の人的レビュヌ

蚀語モデルがハルシネヌションを起こす理由

LLMは、シヌケンス内の次の単語を予枬するこずで機胜したす。デヌタベヌスを参照したり、事実を根拠ずなる真実に察しお怜蚌したりしたせん。トレヌニングデヌタのパタヌンに基づいお確率を蚈算したす。この基本的な蚭蚈—蚀語タスクに非垞に効果的—は本質的にハルシネヌションぞの圧力を生み出したす。

コアメカニズム

  • トヌクン予枬、事実怜玢ではない。 モデルのアヌキテクチャは蚀語生成甚に最適化され、事実怜蚌甚には最適化されおいたせん。プロンプトが質問をするず、モデルの目暙は、テキストの銖尟䞀貫した、もっずもらしい継続を生成するこずです。䞀貫性ず真実は同じではありたせん。虚停のステヌトメントは、䞍確実性の承認よりも銖尟䞀貫しおいる可胜性がありたす。
  • トレヌニングデヌタの隙間ず有効期限。 モデルは、特定の終了日付を持぀デヌタでトレヌニングされおいたす。情報ギャップ—トレヌニング䞭にモデルが遭遇したこずのないトピック、トレヌニングカットオフ埌の最近のむベント、狭い領域の専門知識—は空癜を生み出したす。これらのギャップに぀いお聞かれた堎合、モデルは予枬する真実のパタヌンがありたせん。「この情報を持っおいない」ず蚀う代わりに、もっずもらしく聞こえる詳现を発明したす。
  • 明瀺的な信頌メカニズムがない。 モデルは各出力の暪に信頌スコアを生成したせん。圌らは、「この䞻匵に぀いお30%確実です」ず蚀う内郚信号なしでテキストを生成したす。出力でペヌゞを埋める圧力は、疑いを通知するか、リク゚ストを拒吊するオプションを䞊回りたす。
  • 回答を芁求するプロンプトからの圧力。 「トピックに぀いお説明する」や「理由ステヌトメントのすべおの理由をリストする」のようなプロンプトは、暗黙的に䌝えたす*あなたが䞍確かであっおも、あなたは答える必芁がありたす*。モデルはリク゚ストを満たすために詳现を発明するこずによっお応答したす。有甚であるこずぞの圧力を、䞍正確である危険よりも重芁ずしお扱いたす。
  • コンテキストりィンドりの制限ず情報喪倱。 LLMは、メモリ内に有限の量のコンテキストのみを保持できたす。長いドキュメントたたは䌚話により、以前の詳现がフェヌドしたす。モデルは、前のセクションで䜕が蚀われたかを忘れたり、それを発明したり、誀ったり、以前のコンテキストず䞀貫しおいるかのように自信を持っおそのでっち䞊げを䞻匵したりする可胜性がありたす。コンテキストりィンドりに関するガむドを参照しお、これが発生する理由ず、トヌクン制限が出力信頌性に圱響を䞎える方法を確認しおください。
  • 倚段階の掚論での混乱。 耇数の掚論ステップを必芁ずする問題の堎合、モデルは䞭間結果を倱う可胜性がありたす。結論を正圓化するためにサポヌトステップを発明したり、ステップをスキップしお虚停の結論にゞャンプしたり、論理的に正しく聞こえるテキストを生成したりする可胜性がありたす。長い掚論チェヌンでトヌクンずコストがどのようにスケヌリングするかを理解するず、粟床ず効率のバランスを取るのに圹立ちたす。

ハルシネヌションの䞀般的なタむプ

ハルシネヌションは認識可胜なパタヌンで来たす。タむプを識別するこずは、緩和戊略をタヌゲットするのに圹立ちたす。

TypeExampleWhy It HappensSeverity
架空の出兞ピアレビュヌ枈みのペヌパヌぞの匕甚が存圚しない停の著者名ず公開幎モデルは数癟䞇の匕甚でトレヌニングされ、匕甚のようなパタヌンを孊習し、新しい匕甚を発明非垞に高い
誀った事実日付、数字、名前歎史的なむベントを誀った幎に述べ䞍正確な䌝蚘の詳现トレヌニングデヌタは䞍完党たたは矛盟しおいるモデルはもっずもらしく聞こえる数字を遞択非垞に高い
停造URL および電子メヌルリンクたたはメヌルアドレスを提䟛し、解決しないか、請求された組織に属しおいないモデルはURLずメヌルのパタヌンを孊習し、珟実的だが架空の新しいパタヌンを生成高い
コンテキスト損倱モデルが以前のコンテキストを理解しおいるかのように質問に答え、実際には倱われたコンテキストりィンドりは有限です長いドキュメントは以前の詳现をモデルの泚意から枛退させたす高い
圹割ドリフト1぀の圹割アナリストで始たり、埐々に別のストヌリヌテラヌに移行し、ギャップを埋めるために詳现を発明モデルは最初の指瀺の远跡を倱い、テキストのみにパタヌンマッチングに戻る䞭皋床
過信の䞀般化特定のトレヌニング䟋のみが瀺す堎合、「すべおのXがYを行う」ず述べるモデルは限られたトレヌニングデヌタから広すぎお䞀般化し、信頌チェックなし䞭皋床
内郚矛盟同じ応答内で察立する事実を述べるモデルは耇数の文を超えお䞀貫性を远跡するメカニズムがない䞭皋床

ハルシネヌションの7぀のタむプは架空の出兞、誀った事実、停造URL および電子メヌル、コンテキスト損倱、圹割ドリフト、過信の䞀般化、および内郚矛盟。

プロンプト蚭蚈がハルシネヌションリスクに圱響を䞎える方法

あなたのプロンプトはハルシネヌションを奚励たたは萜胆させたす。違いは枬定可胜です。

ハルシネヌションリスクを増加させるプロンプト

  • 「トピックに぀いおすべおを教えおください」—制限なし、「わかりたせん」ず蚀う蚱可なし
  • 「倚くの詳现を含めるこずを確認しおください」—発明された情報でスペヌスを埋めるための明瀺的な圧力
  • 「あたかも䞀流の専門家であるかのように曞く」—䞍確かな請求でさえ、自信を持った䞻匵を促す
  • 「確実でなくおも答えおください」—ハルシネヌションのブレヌキを削陀

ハルシネヌションリスクを枛らすプロンプト

  • 「確実でない堎合は、「わかりたせん」ず蚀うこずができたす」—知識ギャップを認める明瀺的な蚱可
  • 「以䞋のコンテキストからの情報のみを䜿甚しおください」—応答を提䟛されたデヌタに制限し、発明された知識ではない
  • 「事実を意芋から分離しおください。䞍確かな請求に䞍確かなマヌクを付けおください」—モデルを区別するように匷制
  • 「任意の事実䞊の䞻匵に぀いお、あなたの゜ヌスを匕甚しおください」—発明されたサむテヌションを明らかに芋える
  • 「この請求を確認できない堎合は、それを含めないでください」—未怜蚌のステヌトメントに明瀺的な制玄

プロンプトの良い構造

優れたプロンプトは、4぀の芁玠を組み合わせたすa 明確な圹割たたはコンテキストモデルはどのフレヌムを採甚すべきですか、a 特定のタスクどの出力が必芁ですか、実際の入力デヌタどの情報が提䟛されたすか、および明瀺的な制玄モデルがしおはいけないこずは䜕ですか。この構造は、モデルが䜕をすべきかに぀いおの曖昧さを陀去するこずにより、ハルシネヌションぞの圧力を軜枛したす。すべおのプロンプトが必芁ずする5぀の構成芁玠に関するガむドは、䟋を䜿甚しおそれぞれの芁玠をカバヌしたす。 プロンプト゚ンゞニアリングの基瀎の完党な定矩を参照しお、構造が出力信頌性に圱響を䞎える方法に぀いおさらに詳しく説明しおください。

ハルシネヌションを枛らすためのテクニック

3぀の盞補的なアプロヌチはハルシネヌションを枛らしたす - プロンプトレベルプロンプトの䞍確実性を認める制玄ず蚱可を远加 - システムレベル RAG、関数の呌び出し、たたは怜玢を䜿甚しお、実際のデヌタの回答を接地 - モデルレベル耇数の独立したモデルで同じプロンプトを実行しお、コンセンサスによるハルシネヌションを怜出

1. 「わかりたせん」ず蚀う明瀺的な蚱可

モデルに䌝えたす「確実でない堎合、たたは情報を持っおいない堎合は、そう蚀っおください。掚枬しないでください。」 これは、回答を発明する圧力を取り陀きたす。倚くのモデルは圹立぀ようにトレヌニングされおおり、完党に䞍確実であっおも回答しようずしたす。圌らにその期埅から明瀺的に解攟されるこずを䞎えるこずは、圌らに拒吊する蚱可を䞎えたす。

2. ゜ヌスたたは蚌拠を求める

リク゚スト「事実䞊の䞻匵に぀いお出兞を匕甚するか、各参照のURLず発衚日を提䟛したす。」 これは発明されたサむテヌションを明らかにそれらは解決されたり、存圚しない゜ヌスを指したす、モデルをファクトアサヌションに関する慎重さを匷制したす。たた、出力を怜蚌する方法を提䟛したす各リンクをクリックし、各゜ヌスを確認したす。

3. 自己批刀ず矛盟チェック

モデルに独自の出力を確認するように求めたす > 「回答を終了した埌、矛盟たたは以前に蚀ったこずず矛盟する請求に぀いお確認しおください。芋぀けた矛盟を指摘しおください。」 モデルは、反映するよう求められたずきに独自の゚ラヌをキャッチするこずがよくありたす。その埌、モデルはあなたがそれを芋る前に答えを改正できたす。

4. 吊定的な指瀺を䜿甚する

モデルがしおはいけないこずを明瀺的に述べたす

  • 「いかなる状況䞋でも、゜ヌス、URL、たたは著者名を発明しないでください」
  • 「確実でない堎合は日付を掚枬しないでください—掚枬する代わりに日付を空癜にしおください」
  • 「提䟛されたコンテキストに含たれおいない情報を远加しないでください」

吊定的なフレヌミングは、特定の゚ラヌを防ぐために肯定的なフレヌミングよりも優れた堎合がありたす。

5. 怜蚌による段階的な掚論

耇雑なタスクの堎合、質問 > 「これをステップバむステップで䜜成したす。各ステップの埌、前のステップが正しいこずを確認しおから、次のステップに進みたす。」 タスクをより小さなチャンクに分割し、怜蚌ステップを䜿甚するず、矛盟が化合する前にモデルをキャッチするチャンスをキャッチしたす。

6. 蚌拠セクションを備えた構造化出力圢匏

モデルに、応答、掚論、蚌拠を異なるセクションに分離するよう䟝頌したす ``` 応答盎接応答 掚論この回答に到達した方法 蚌拠これをサポヌトする゜ヌス、事実、たたは匕甚 信頌あなたはどの皋床確実で、なぜか ``` この構造により、ハルシネヌションは簡単に芋えたすサポヌトされおいない請求は、空のたたは曖昧な蚌拠セクションず䜎い信頌倀がありたす。

プロンプト蚭蚈以倖のシステムレベル戊略

プロンプトだけは高リスク䜜業には䞍十分です。これらのツヌルずワヌクフロヌを远加したす。

  • Retrieval-Augmented GenerationRAG。 モデルに特定のドキュメント、ナレッゞベヌス、たたはデヌタセットを提䟛し、そのコンテンツのみを䜿甚しお回答するよう䟝頌したす。これにより、モデルのトレヌニングデヌタの代わりに実デヌタにアンカヌされた応答を接地し、欠萜情報に぀いおのハルシネヌションを排陀したす。LangChain、Anthropic'sプロンプトキャッシング、ベクトルデヌタベヌスなどのツヌルはこのパタヌンを実装しおいたす。RAG実デヌタの回答をアンカヌする方法に関する完党なガむドを参照しおください。
  • ツヌル呌び出しず関数の䜿甚。 モデルが蚈算、デヌタベヌスルックアップ、たたは事実確認のための倖郚関数を呌び出すこずを蚱可したす。統蚈を発明する代わりに、モデルはそれを取埗するために関数を呌び出したす。これは特定のドメむンに察しおハルシネヌションする誘惑を完党に排陀したす。
  • 人間のレビュヌず専門家怜蚌。 重倧な決定—医療、法埋、財務、安党クリティカル—に぀いおは、垞に人間理想的には専門家がAIで生成された回答を確認させおください。プロンプト技術ぱキスパヌトゞャッゞメントの代わりになりたせん。
  • 自動ファクトチェックワヌクフロヌ。 自動システムファクトチェックAPI、URL怜蚌、匕甚怜蚌を通じおモデル出力を実行しおから、ナヌザヌに衚瀺したす。これは、すべおの出力の手動レビュヌなしにハルシネヌションを倧芏暡に怜出したす。

耇数のモデルずコンセンサス怜出

単䞀のモデルは自信を持っおハルシネヌションできたす。しかし、耇数の独立したモデルに同じ質問をする堎合、圌らはしばしば幻想的な請求に぀いお意芋が異なりたす。 5぀のモデルが独立しお質問ぞの類䌌した回答を生成する堎合、その答えは単䞀のモデルが回答するよりもはるかに正確である可胜性がありたす。1぀のモデルのみが䜕かを䞻匵し、4぀のモデルは蚀及しない堎合、その請求は非垞に疑わしく、怜蚌を正圓化したす。 これはコンセンサススコアリングの背埌にある原則です同じプロンプトを倚くのモデルGPT-4o、Claude 4.6 Sonnet、Gemini 1.5 Pro、Mistral Large、Llama 3、DeepSeekなどに送信し、圌らが同意する堎所ず同意しないかを分析したす。

PromptQuorum コンセンサステスト

PromptQuorumでテスト—15ハルシネヌション傟向プロンプトをGPT-4o、Claude 4.6 Sonnet、およびGemini 1.5 Proに送信 GPT-4oは完党に1぀の匕甚を䜜成したした。Claude 4.6 Sonnetは未怜蚌のペヌパヌを匕甚するこずを拒吊したした。Gemini 1.5 Proは3぀の実際のペヌパヌを匕甚したしたが、1぀は幎が正しくありたせん。1぀の匕甚のみが3぀すべおのモデル応答に衚瀺されたした。このテストは、モデル党䜓のコンセンサスが信頌性の有意な信号である—そしお、単䞀モデル応答がより倚くの補造を含む可胜性があるこずを実蚌しおいたす。 PromptQuorumはこれを自動化したす25 +のAIモデルに同時に1぀のプロンプトを送信し、すべおの回答党䜓でコンセンサス分析を実行し、どの請求が高い合意を持っおいるかおそらく信頌できるず䜎い合意さらに調査する䟡倀があるに぀いおの刀決を埗たす。ツヌルは、どの請求が矛盟するかを正確に暙識し、1぀たたは2぀の応答にのみ衚瀺される請求を衚瀺し、機胜別にモデル応答を重み付け—ハルシネヌション怜出を根拠のない掚枬から構造化された、デヌタドリブン分析に倉換したす。 マルチモデルAIがハルシネヌションを枛らす方法を参照しお、より深い技術的説明を行うこずを参照しおください。

ハルシネヌションガバナンスのグロヌバルパヌスペクティブ

ハルシネヌションリスクず軜枛戊略は地域ず芏制の文脈によっお異なりたす。ペヌロッパでは、EU AI Actは高リスクAIシステムの透明性ず゚ラヌ報告を匷調し、ハルシネヌション文曞を矩務的にしたす。Mistral AIフランスは、EUコンプラむアント性のアプリケヌションでハルシネヌション削枛に特定の焊点を持぀モデルを構築しおいたす。䞭囜では、Qwen 2.5やDeepSeekなどのモデルは、トレヌニングデヌタ構成ずCJK蚀語䞭囜語、日本語、韓囜語のためのトヌクン化効率によるハルシネヌションパタヌンが異なりたす—これらのモデルは、英語最適化モデルずは異なるトヌクン-to-information比を凊理したす。日本では、METI経枈産業省デヌタガバナンスガむドラむンの䞋で動䜜する䌁業は、デヌタ居䜏暩ずコンプラむアンスを確保するために、ハルシネヌション傟向のタスクのためにモデルをロヌカルに展開たす。 地域に関係なく、コアテクニックRAG、コンセンサスチェック、人的レビュヌは普遍的に適甚可胜です。芏制の文脈ず蚀語芁件に基づいおモデルを遞択しお怜蚌しおください。

ハルシネヌションが最も危険な堎合

ハルシネヌションは特定のドメむンで重倧な害のリスクがありたす。特に泚意しおください

  • 医療および健康決定 —誀った薬物名、甚量、たたは症状の解釈は患者に害を及がす可胜性がありたす
  • 法埋およびコンプラむアンス —䜜成された刀䟋法、芏制芁件、たたは前䟋は、高額な゚ラヌたたは違反に぀ながる可胜性がありたす
  • 財務アドバむス —誀った垂堎デヌタ、䞍正確な皎情報、たたは補造されたパフォヌマンスメトリックは、高リスク決定を誀ったりたす
  • 安党クリティカルシステム —コヌドレビュヌ、建築決定、たたはセキュリティ分析のハルシネヌションは、脆匱性たたはバグを導入できたす
  • パブリック垰属 —あなたの名前たたはブランドの䞋で公開されたもの、幻想は信頌性を傷぀けるこずが確認する必芁がありたす

重芁な原則完党なプロンプトずコンセンサスチェックであっおも、人的怜蚌は高リスク決定に䞍可欠です。AIを時間節玄ずファヌストパスツヌル䜿甚し、゚キスパヌトゞャッゞメントたたはプラむマリ゜ヌス怜蚌の亀換ではなく。 自己批評技術が耇雑な掚論タスクで゚ラヌをさらに削枛する方法を孊びたす。

実践的なチェックリスト重倧なプロンプトを送信する前に

重倧なプロンプトに䟝存する決定たたは公開出力を送信する前に、このチェックリストを䜿甚したす

  • プロンプトは明瀺的に「わかりたせん」を蚱可したすか远加「確実でない堎合は「わかりたせん」ず蚀えたす」
  • プロンプトに実際のコンテキストたたはデヌタはありたすか曖昧なプロンプトは発明を招埅したす。具䜓的なドキュメント、䟋、たたは入力デヌタを提䟛したす。
  • 制玄は明瀺的ですかモデルがしおはいけないこずを述べ、特に「出兞、URL、たたは匕甚を発明しないでください。」
  • 出力圢匏は構造化されおいたすか応答/掚論/蚌拠/信頌を分離したす。これにより、サポヌトされおいない請求が明らかになりたす。
  • ゜ヌスを芁求しおいたすか 事実䞊の請求に぀いおは、次を芁求したす「この事実に぀いお出兞を匕甚しおください。」
  • タスクは具䜓的で、未ではありたせんか 「*金融の専門家をタヌゲットにするB2Bスタヌトアップ甚に5぀のマヌケティング戊略をリストしおください*」は「マヌケティングに぀いお教えおください。」より優れおいたす
  • モデルに自己確認を求めたしたか远加「提出する前に矛盟に぀いお回答を確認したす。」
  • 高リスク決定の堎合は、亀差チェックしおいたすか 耇数のモデルに同じプロンプトを送信し、回答を比范しおください。

プロンプトの䟋の前/埌

悪いプロンプト

人工知胜の歎史に぀いお教えおください。倧きな進歩ず重芁な研究者を含めおください。

これが倱敗する理由オヌプン゚ンド、制玄なし、䞍確実性を認める蚱可なし。モデルは日付を発明し、進歩を誀信し、時代遅れの情報を自信を持っお述べ、おそらく存圚しないペヌパヌを匕甚したす。

良いプロンプト

以䞋の時間線のみを䜿甚しお、1950幎から1990幎のAIの倧きな進歩を芁玄したす {TIMELINE DATA INSERTED} あなたの答えを次のようにフォヌマット 進歩 {名前} 幎 {幎—時間線に蚘茉されおいる堎合のみ} 重芁性 {䜕を有効にしたか} ゜ヌス {時間線のどのドキュメントがこれを蚀及しおいたすか} 時間線にない情報を远加しないでください。䜕かが時間線にあるかどうか確実でない堎合は、掚枬するのではなくスキップしおください。

これが機胜する理由

  • 発明ではなく実デヌタモデルは提䟛されたコンテキストから動䜜し、トレヌニングデヌタギャップからではない
  • 構造化出力圢匏により、欠萜しおいる゜ヌスが即座に明らかになりたす
  • 吊定的指瀺 "時間線にない情報を远加しないでください"は明瀺的です
  • 省略する蚱可 "確実でない堎合はスキップしおください"は詳现を発明する圧力を削陀
  • ゜ヌス責任 すべおの請求は、どのドキュメントがそれから来たかを匕甚するこずが必芁です

よくある質問

ハルシネヌションは完党に排陀できたすか

いいえ。ハルシネヌションはどの蚀語モデルが機胜するか固有—圌らは怜蚌枈みストアから事実を取埗するのではなくテキストパタヌンを予枬したす。優れたプロンプト蚭蚈、RAGなどのツヌル、マルチモデルコンセンサスを倧幅に削枛できたすが、珟圚のLLMアヌキテクチャを考えるず完党な陀去は䞍可胜です。人的怜蚌は高リスク決定のために必芁なたたです。

モデルが間違っおいる堎合、なぜそんなに自信を持っおいるようですか

蚀語モデルは流暢で䞀貫したテキストを生成するようにトレヌニングされおいたす。自信は蚀語的䞀貫性の副䜜甚です。虚停のステヌトメントは、䞍確実性の正盎な認識よりもはるかに䞀貫しおいお、よくたずたっおいる可胜性がありたす。モデルは疑いを衚珟する組み蟌みメカニズムを持っおいたせん—正確性に関係なく、同じ流暢な自信でテキストを生成したす。

より新しく、より倧きなモデルはハルシネヌションが少ないですか

より倧きなモデルは、もっずもらしく聞こえるテキストを生成するのが優れおいるため、いく぀かのタスクでより倚くハルシネヌションしたす。これにより、虚停の䞻匵が怜出しにくくなりたす。しかし、より新しいモデルはいく぀かの事実タスクより最近のトレヌニングデヌタず匷い指瀺フォロヌでより良く実行したす。モデルサむズずハルシネヌション間の関係はタスク䟝存であり、単調ではありたせん。

モデルをむンタヌネットに接続するず、ハルシネヌションが削陀されたすか

䞀郚。リアルタむムWebアクセスは珟圚のむベントず最近のファクトに圹立ちたすが、コアの問題を解決したせんモデルはただ詳现を発明し、怜玢結果を誀ったり、実際に取埗しなかったコンテンツに぀いおハルシネヌション。むンタヌネットアクセスはハルシネヌションの1぀のクラスを削枛するツヌルであり、治療法ではありたせん。

回答がハルシネヌションであるかどうかを玠早く確認するにはどうすればよいですか

゜ヌスを確認するURLをクリックするか、匕甚されたペヌパヌを怜玢したす。存圚しない堎合、回答はハルシネヌションです。事実を確認する信頌できる゜ヌスに察しお日付、名前、数字を確認したす。耇数のモデルを比范する異なるモデルに同じ質問をしおください。鋭い意芋の䞍䞀臎は、少なくずも1぀がハルシネヌションしおいるこずを瀺唆しおいたす。ドメむンの専門知識を適甚するフィヌルドを知っおいるなら、埮劙な䞍可胜に぀いお批刀的に読む—ハルシネヌションはしばしば専門家の読者にずっお暎露のしるしを持っおいたす。

ハルシネヌションする堎合、AIの䜿甚を停止する必芁がありたす

いいえ。怜蚌でAIを戊略的に䜿甚しおください。ブレヌンストヌミング、ドラフト䜜成、探怜的な작업に぀いおは、ハルシネヌションは軜埮な䞍䟿です。事実クリティカルな䜜業研究、コンプラむアンス、医療決定、財務アドバむスに぀いおは、AIを開始点ずしお䜿甚し、その埌、信頌できる゜ヌスたたは専門家のレビュヌですべおを確認したす。

ハルシネヌション真の誀りの違いは䜕ですか

ハルシネヌションは自信を持ち、間違いです。モデルが"確実ではありたせんが、それはXかもしれたせん"ず蚀う堎合、それは正盎な䞍確実性であり、ハルシネヌションではなく。 "フランスの銖郜はベルリンです"ず完党な自信を蚀う堎合、それはハルシネヌション—モデルが事実であるかのように䜕か停りを述べたした。ハルマヌクは䜕かが真実ではない自信を持った䞻匵です。

関連読曞

゜ヌス

  • Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." ArXiv —段階的な掚論が数孊およびロゞックタスクのハルシネヌションを削枛するこずを実蚌する基瀎論文。
  • Maynez, J., Narayan, S., Hashimoto, B., & Hardt, D. (2021). "On Faithfulness and Factuality in Abstractive Summarization." ACL Proceedings —神経テキスト生成のハルシネヌション率ずメカニズムの経隓的研究。
  • Anthropic (2024). "Constitutional AI." https://www.anthropic.com/constitutional-ai —原則ベヌスの蚓緎を通じお有害な出力ずハルシネヌション削枛するためのAnthropicのアプロヌチ。

これらのテクニックをPromptQuorumで25以䞊のAIモデルに同時に適甚したしょう。

PromptQuorumを無料で詊す →

← プロンプト゚ンゞニアリングに戻る

AIハルシネヌションAIがなぜ物を䜜り出すのか — そしおそれを止める方法 | PromptQuorum