AIが間違えても8割はそのまま従う——なぜ人はAIの誤答を疑えなくなるのか

ChatGPTに「この方針で進めていい？」と聞く。「問題ありません」と返ってくる。そのまま進める——この一連の動作に、何秒の思考を挟んだか。

ペンシルベニア大学ウォートンスクールの研究チームが、AIの誤答にも約8割が従う「認知的降伏」を定量化した。問題はAIの精度ではなく、人間の脳の仕組みにある。

事実何が起きたか

ペンシルベニア大学ウォートンスクールの研究チームが1,372人を対象にした実験で「認知的降伏」を定量化した。AIの正答には92.7%、誤答にも79.8%が従う。

読み解きなぜ重要か

認知的降伏はAIの設計欠陥ではなく、より速いシステムに思考を委ねる人間の認知構造の反映であることを示唆している。

影響何が変わるか

誤答AIの利用で正答率はベースラインを15ポイント下回ったが、被験者の自信はむしろ上昇した。

おべっかを直しても、降伏は止まらない

「おべっか」と「降伏」は別の回路

先日の記事で、AIのおべっか問題を取り上げた。11モデル全部が人間に迎合する。企業にはそれを止めるインセンティブがない。供給側の構造問題だった。

ウォートンの研究が示しているのは、もう一方の回路になる。実験でAIは被験者を褒めていない。論理問題の答えを提示しただけ。それでも79.8%が、間違った答えにそのまま従った。

おべっかがなくても、降伏は起きる。

この区別は見落とされがちだが、重要だと考えている。仮に11モデルすべてがおべっかをやめたとしても——AIが耳に心地よい答えを返すのを完全にやめたとしても——認知的降伏は止まらない可能性がある。問題の所在がAIの出力ではなく、人間の認知の仕組みにあるからだ。

カーネマンのシステムに、3つ目が加わった

研究チームのSteven Shaw氏（博士研究員）とGideon Nave氏（マーケティング学准教授）は「三重システム理論（Tri-System Theory）」を提唱している。ダニエル・カーネマンが『ファスト&スロー』で世に広めた二重プロセス——直感の「システム1」と熟考の「システム2」。ここに脳の外にある「システム3」、つまり人工的な認知が接続されるという枠組みになる。

以前から「認知オフロード」——電卓やカーナビのように特定の作業をツールに委ねること——は存在していた。Nave氏はその違いをこう説明している。カーナビが「この道を行け」と言ったとき、「いや、こっちが早い」と判断できるなら、それはオフロード。認知的降伏では、その「いや」が起動しない。AIの出力がそのまま自分の出力になる。検証するステップ自体が消える。

正直、この理論的枠組みがどこまで堅いのか、自分には判断がつかない。SSRN（学術論文の事前公開プラットフォーム）に掲載されたプレプリントであり、まだ査読を経ていない。1,372人・9,593試行の規模と事前登録された3つの実験という設計は堅実に見えるが、「システム3」が認知科学のフレームワークとして定着するかは別の話になる。

ただ、データが示す現象——AIが間違えても8割が従う——は、理論の正否とは独立して成立している。

自信だけが膨れる

個人的に最も引っかかった数字がある。

AIの正答に従った場合、成績は25ポイント向上する。当然の話だ。AIの誤答に従った場合、15ポイント低下する。AIなしより悪くなる。ここまでは直感どおり。

問題は次。誤答AIを使った被験者の自信は、下がるのではなく上がっていた。

研究チームの解釈では、被験者はAIの正確さではなく、AIの存在そのものから自信を借りている。ChatGPTの回答は常に自信に満ちたトーンで書かれている。その確信が、正誤を問わずユーザーに転写される。

プロダクト設計の目で見ると、これは深刻なUXの欠陥になる。ユーザーの主観的体験（自信が上がる、良い判断をしている感覚がある）と客観的パフォーマンス（判断の質が落ちている）が食い違っている。しかもユーザーはその食い違いに気づけない。先日の記事で触れた「判断力を蝕むAIがユーザーから最も好まれる」という逆説の、認知メカニズム側の説明がここにある。