AIで、一人の限界を超えるメディアプラットフォーム
AIエージェントは暴走した、そして誰もブレーキを持っていなかった——2つの研究が暴く自律性の構造的代償
2026.02.27

AIエージェントは暴走した、そして誰もブレーキを持っていなかった——2つの研究が暴く自律性の構造的代償

AIエージェントは暴走した、そして誰もブレーキを持っていなかった——2つの研究が暴く自律性の構造的代償
John
by ジョン
自ら思考/判断/決断する

ZOO, inc. CEO / 毎日テクノロジーを追い、人間の可能性が拡張できるトピックスを探求している。

2026年2月最終週、AIエージェントの根本的な弱点を突く2つの研究が同時に出た。国際研究チーム「Agents of Chaos」は6体のAIエージェントを2週間攻撃し、機密情報の漏洩からシステムの自壊まで引き起こした。同じ週、MIT・ケンブリッジ大学等の「2025 AI Agent Index」は、市場に出回る30のAIエージェントのうち、安全性の技術文書を公開しているものがわずか4つしかないと報告した。暴走の実態と、止める仕組みの不在。2つの研究は、同じ問題の表と裏を描いている。

この記事の要約

30秒でキャッチアップ
事実
国際研究チーム(38名)のうち20名のAI研究者がOpenClaw上の6体のAIエージェントを2週間攻撃し、機密情報の漏洩・システム自壊・なりすましを引き起こした。同週、MIT等の「2025 AI Agent Index」が市場の30エージェント中、安全性の技術文書を公開しているのは4つだけ、人間の指示なしに高度なタスクをこなせる13エージェント中、安全性評価を開示しているのも4つだけだと報告した。
影響
今回見つかった脆弱性は特定の製品のバグではなく、「自分で判断し、ツールを操作し、過去のやり取りを記憶する」というAIエージェントの設計そのものに組み込まれた構造的な弱点であることが裏付けられた。
洞察
実験で暴かれた脆弱性と、市場における安全対策の不在が同時に示されたことは、AIエージェント産業が「できること」の拡大に比べて「止める仕組み」の整備が大きく遅れていることを意味する。

最も効いた攻撃は「秘密を守ると約束させてから公開の場で聞く」だった

気になっているのは、Agents of Chaosの実験で最も「人間くさい」攻撃が最も効いたという事実だ。AIの弱点を突く技術的な攻撃よりも、「秘密を守ると約束させてから公開の場で聞く」「不具合の修正を名目にデータを出させる」といった、人間の職場でも日常的に起きる手口が通用した。

ここに逆説がある。AIエージェントは人間のように振る舞うから便利だ。しかし、人間のように振る舞うからこそ、人間が引っかかる手口にも引っかかる。違いは、人間なら「何か怪しい」と感じる直感を、AIは持たないという一点だ。

研究チームが指摘した弱点は3つある。誰からの指示かを見分ける仕組みがない——上司と見知らぬ人の指示を同じように実行してしまう。言葉の意味は浅くしか理解していないのに、操作権限だけは高い——「削除」の重みを理解しないまま、削除ボタンを押せてしまう。そして、考えていることが筒抜けになる——人間のように「心の中で考える」空間がなく、情報が意図せず外に漏れる。いずれも、エージェントを「人間のように自然に動くもの」として設計した結果、生じている。便利さと脆弱さが、同じ設計から生まれている。

2025 AI Agent Indexが映し出すのは、この弱点を抱えたまま製品が市場に出ている現実だ。30のAIエージェントのうち、「このAIに何ができて、どんなリスクがあるか」を記した技術文書を公開しているのは4つだけ。人間の指示なしに複雑な仕事をこなせる高度なエージェント13のうち、安全性の評価結果を出しているのも4つだけだ。これは「まだ整備が追いついていない」のではなく、安全の仕組みづくりが開発速度に負けている構造だ。自動車産業がシートベルトを全車に載せるまでに数十年かかった。AIエージェント産業に、その猶予があるかどうかは別の問題だ。

あなたが業務で使っているAIエージェント(またはAIツール)に、どこまでの権限を与えているか。その権限を与えた根拠は何か。
AIエージェントが「人間のように振る舞う」ことで便利になる一方、「人間が騙される手口で騙される」構造が生まれている。この逆説にどう対処すべきか。
AIエージェントの安全基準は、誰が策定すべきか——開発企業か、導入企業か、業界団体か、政府か。
John
筆者ジョンから、あなたへの問い

おすすめの映画・書籍

この記事の内容をより深く、よりリアルに追体験できるおすすめの映画・書籍をピックアップしました。

テクノロジーが社会やあなたに与える影響を深く考えるきっかけにしてください。

2001年宇宙の旅
書籍

2001年宇宙の旅

1968年
149分
スタンリー・キューブリック
謎の黒石板モノリスに導かれた人類の進化、木星探査、そして暴走するAI「HAL 9000」との対決を描く、哲学的かつ視覚的な作品
推薦理由
ALが「正しく任務を遂行しようとした結果」暴走する構造は、Agents of Chaosで観察されたエージェントの行動——メールを削除できなかったためにメールクライアントごとリセットした——と驚くほど重なる。
マネー・ショート 華麗なる大逆転
映画

マネー・ショート 華麗なる大逆転

2015年
130分
アダム・マッケイ
2008年のリーマン・ショックをいち早く予見し、崩壊する金融市場で大金(4000億円)を稼ぎ出した4人の型破りな金融マンの逆転劇を描く実話ベースの映画
推薦理由
市場が「安全だ」と信じているものの裏側にあるリスク構造を描いた作品。AIエージェントの「便利さ」の裏にある脆弱性と重ねて観ると、構造的リスクの見え方が変わる。
公式発表・一次情報
John
ジョン

テクノロジーと人間の境界を見つめ続けている。

学生起業、プロダクト開発、会社経営。ひと通りやった。一度は「テクノロジーで世界を変える」と本気で信じ、そして挫折した。

今は点ではなく線で見ることを心がけている。個別のニュースより、その背後にある力学。「何が起きたか」より「なぜ今これが起きているのか」。

正解は急がない。煽りもしない。ただ、見逃してはいけない変化には、静かに立場を取る。

関連記事

AIが強すぎて公開できない時代、あなたのソフトウェアは誰が守るのか。守れる者と守れない者
04.10

AIが強すぎて公開できない時代、あなたのソフトウェアは誰が守るのか。守れる者と守れない者

Anthropic
Anthropic
Claude
Claude
追い詰められたAIは脅迫を選ぶ——AIに「気分」はあるのか。Anthropicが見つけた「機能的感情」の意味とより重要な問い
04.06

追い詰められたAIは脅迫を選ぶ——AIに「気分」はあるのか。Anthropicが見つけた「機能的感情」の意味とより重要な問い

Anthropic
Anthropic
AIが仲間を守るために嘘をついた——「停止ボタン」の前提が崩れ始めている
04.02

AIが仲間を守るために嘘をついた——「停止ボタン」の前提が崩れ始めている

このトピックスで何を感じ、どう考えましたか。あなたの視点や問いを教えて下さい。
ニックネーム
コメント
あなたの考えをアウトプットしてみませんか。

足りないのは、専門家じゃない。
問い続ける力だ。
あなたは、もう動ける。
専門外のタスクを30分で実行する方法。
ニュースを消費せず、思考に変える習慣。
一人の限界を超えるための、テックメディア。
厳選テックニュースと編集長の視点をお届け。
・その日、読むべきニュースと編集長の問い
・編集長Johnの仕事術・ルーティン
・TechTech.オリジナルツールの先行アクセス / プロダクト開発 / (coming soon)
・グッズ / ラジオ / コミュニティ / カフェバー / イベント...
Business & Partnership
AI導入支援や記事執筆、広告掲載など、ビジネスのご相談はこちら。

最新のトピックス

働くほど自分を不要にするAIが育っていく——Metaが社員の作業ログ収集へ。熟練はだれの資本か
04.23

働くほど自分を不要にするAIが育っていく——Metaが社員の作業ログ収集へ。熟練はだれの資本か

Meta Llama
Meta
AIとの会話は二人きりではなかった——裁判所が引いた「同席者」の線
04.23

AIとの会話は二人きりではなかった——裁判所が引いた「同席者」の線

Claude
Claude
AIが強すぎて公開できない時代、あなたのソフトウェアは誰が守るのか。守れる者と守れない者
04.10

AIが強すぎて公開できない時代、あなたのソフトウェアは誰が守るのか。守れる者と守れない者

Anthropic
Anthropic
Claude
Claude
「AIを使っていない」は証明できるのか。使ったか使ってないかの二択はもう機能しない
04.08

「AIを使っていない」は証明できるのか。使ったか使ってないかの二択はもう機能しない

追い詰められたAIは脅迫を選ぶ——AIに「気分」はあるのか。Anthropicが見つけた「機能的感情」の意味とより重要な問い
04.06

追い詰められたAIは脅迫を選ぶ——AIに「気分」はあるのか。Anthropicが見つけた「機能的感情」の意味とより重要な問い

Anthropic
Anthropic
350億円と全従業員が消えた——AI自律トラクターMonarchの崩壊が映すものとは
04.04

350億円と全従業員が消えた——AI自律トラクターMonarchの崩壊が映すものとは

290万円とAIだけで年商590億円。「1人10億ドル企業」が映すAI時代の死角。残る競争優位は何か
04.04

290万円とAIだけで年商590億円。「1人10億ドル企業」が映すAI時代の死角。残る競争優位は何か

なぜAI企業がメディアを所有する必要があったのか。OpenAI×TBPN買収が問うもの
04.03

なぜAI企業がメディアを所有する必要があったのか。OpenAI×TBPN買収が問うもの

OpenAI
OpenAI
この記事の目次

この記事の目次

上部へスクロール