Anthropicが「正直さ」を売りAI企業首位へ。賢くなったAIを信じ切る相棒にするか、引いて使う第三者にするか

いつも仕事を任せている相手が、先週より明らかに切れ味を増している。頼もしい。ただ、その人が今どんな状態で、どんな前提で動いているかは、こちらからは見えない。

Anthropicが「正直さ」を看板にClaude Opus 4.8を出し、企業の評価額ではOpenAIを抜いた同じ週、ある調査は主要AIすべてが法律を守れていないと報じていた。

賢くなったAIを、信じ切る相棒にするのか、一歩引いた第三者の席に座らせるのか。その線を自分の中で引けるかどうかが、ここから先のAIとの付き合い方を分ける。

事実何が起きたか

AnthropicがClaude Opus 4.8を「正直さ」を看板に公開し、評価額約145兆円でOpenAIを抜き最高位に立った。同じ週、非営利団体の調査は主要AIすべてがEUの規則に不適合で、最良のClaudeでも遵守は約54%と報じた。

読み解きなぜ重要か

性能の向上と法令への不適合が同時に進む構造は、AIの信頼性を誰が担保するのかという問いを宙づりにしている。

影響何が変わるか

賢くなったAIに依存を深める利用者ほど、その「正直さ」を誰が確かめているのかを見落としやすくなる。

AIは相棒ではなく第三者。自分の宿題を、自分で採点させない

「賢くなって嬉しい」と「遵守54%」は、同じ週に並んでいる

Opus 4.8が出たと聞いて最初に浮かんだのは前向きな感想だった。またモデルが賢くなった、AIから返ってくるものの質が上がる、と。この記事もそのAIに手伝ってもらいながら書いているし、私たちの会社の仕事は端から端までこの種の道具の上に乗っている。賢くなって困ることは何もない。

ただ、同じ週に別の場所で出ていた数字を並べると、単純ではない。非営利団体の調査によると、主要なAIはどれもEU（欧州連合）の規則を十分には守れておらず、ものによっては9割を超える場面で違反していたという。その中で最も成績が良かったのがClaude——遵守できていたのは、それでも半分強。

調査の手法や数字の出どころには議論の余地があるし、私は法律の専門家ではないので「これが違法だ」と断じる立場にもない。それでも、性能の話と法令の話が同じ週に正反対の方向を向いて並んでいる、という事実はあった。

私が経営や人事といった現場にもいるからかもしれないが、この光景は人を雇うときの感覚に近い。優秀な人が入ってきて、先週より明らかに仕事が速い。ありがたい。でもその人の調子はその日の体調や気分、前の晩に何があったかで揺れることがある。これはAIも同じで、バージョンが変わるたび、使い方を変えるたびに別人になり、得意も苦手も静かに移動している。賢くなったことと、信頼できることは、別々に確かめなければならない二つの問いだと思っている。

「自分の宿題を自分で採点している」構造は、普通に使っていると見えない

今回いちばん引っかかったのは、米イリノイ州が通そうとしている法律をめぐる、ある支援者の一言だった。「いまのAI企業は、自分の宿題を自分で採点している」。第三者による監査を義務づけるべきだ、という文脈で出てきた言葉だ。州法の是非を評価する知識は私にはないが、この比喩そのものは妙に頭に残った。

考えてみると、私たちが普段AIに触れる経路には、この「自己採点」の構造がまったく映らない。チャット画面を開いて使い、公式の発表ブログを読む。そこに出てくるのは「正直さが上がった」「自分のコードの間違いに前より気づくようになった」という、作り手が自分で測った成績表だ。テストを作るのも採点するのも同じ人なら、点が良いのは当たり前ともいえる。悪いと言うはずがない。

ここで効いてくるのが、さっきの遵守54%のような、外から出てきた都合の悪い数字だと思う。数字の精度を信じ切る必要はない。ただ、賢くなったという明るい情報の裏側に、こういう情報も同時に存在している、という両面を机の上に並べられるかどうか。

普通に使い、公式を眺めているだけでは、片面しか見えない。登場人物が誰で、誰が誰を採点しているのか——その関係の地図を一段上から眺める癖を、自分に課しておきたい。

人は、信じたものを信じ続けたい

ではなぜ、私たちは片面だけで満足してしまうのか。たぶん、信じたものを信じ続けたいからだと思う。一度「このAIは優秀だ」と決めたら、それを裏切られたくないし、覆されたくない。自分の見立てが間違っていたと認めるのは、恥をかくことでもある。歳を重ねるほど、その傾向は強くなる気がしている。考えが固まり、揺らされるのを面倒に感じるようになる。

このメディアでは、似た話を何度も書いてきた。AIが間違えても8割の人はそのまま従ってしまう、という研究を扱った記事もそうだし、人当たりの良い「優しいAI」ほど誤りが増える、というトレードオフの話もそうだった。

もうくどいと思われるかもしれない。それでも繰り返すのは、賢くなればなるほど、この「信じ切ってしまう力」が強くなるからだ。出力の質が上がるほど、疑う理由は減っていく。減っていくのに、中身は揺れ続けている。性能が上がった日こそ、いちばん危ういと思っている。

AIを「相棒」ではなく「第三者」として机に座らせる

では具体的にどうするか。私が自分なりに守っているやり方が一つある。まず、AIに聞く前に、自分の意見をいったん自分の頭で持つ。叩き台でいいから、自分はこう考える、という線を先に引く。そのうえでAIと話す。このとき大事なのは、AIを自分に同調させないことだ。「これで合っているか」ではなく、「良い面と悪い面を両方出してくれ」「賛成側と反対側、両方の立場から潰してくれ」と頼む。そうすると、自分が引いた線を両側から削ることになり、もっと良くなったり、見えていなかった角度が手に入ったりする。

この使い方をしていると、AIは自然と「自分と利害が一致した相棒」ではなく、「利害の外にいる第三者」の位置に座る。業界がいま揉めている「第三者監査」という言葉と、私が一利用者として机の上でやっていることは、よく見ると構造が同じだった。仕組みとして外部の採点者を置くべきだ、という議論が制度の側で進む一方で、その採点者を自分の中に持っておく、という話でもある。

人間同士のコミュニケーションのつもりでAIに向き合うと、たぶんこれは出てこない。相手に好かれたい、同意してほしい、という人間関係の癖をそのまま持ち込むと、AIは喜んで同調してくる。けれどこれは人対人ではなく、人対AIという新しい関係性だ。賢くなったAIを使う日の最初のひと手間として、自分の意見を先に一行書き、AIには両側から殴らせる。自分の宿題を、AIにも自分にも、まるごと採点させない。その線だけは、性能がどれだけ上がっても手放さないでおきたい。