2月5日、OpenAIとAnthropicは同日に新モデルを発表した。GPT-5.3 CodexとOpus 4.6——いずれも自らの開発プロセスに関与した初のモデルだ。

その1週間後、両社から研究者が相次いで離脱し、安全チームが解散され、開発者自身が「存在的脅威を感じる」と公に語り始めた。

AI開発の最前線で今起きているのは、技術の加速とそれを制御する人間の確信の喪失が同時に進行するという、前例のない事態だ。

事実 何が起きたか

Anthropicの安全研究チーム責任者が「世界は危機にある」と述べて辞任し、OpenAIは安全監視を担うMission Alignmentチームを解散、xAIでは創業メンバー12人中6人が退社した。

読み解き なぜ重要か

開発者自身が自社製品の安全性に確信を持てないまま開発が加速している構造は、AI産業の安全論が「外部からの批判」ではなく「内部からの警告」の段階に入ったことを示唆している。

影響 何が変わるか

AIの安全性を内部から監視してきた人材と組織が同時期に失われ、業界全体の安全監視体制に構造的な空白が生じている。

Overview

  • Anthropic Safeguards Research Team責任者のMrinank Sharmaが2月9日に辞任し、「世界は危機にある。AIだけでなく、相互に連鎖する危機が進行している」と公開書簡で述べた。
  • OpenAIのエンジニアHieu Phamが2月10日にXで「AIが及ぼす存在的脅威をついに感じた」と投稿し、44万回以上閲覧された。
  • OpenAIは2024年9月に設立したMission Alignmentチームを16か月で解散し、責任者のJosh Achiamを「チーフ・フューチャリスト」に異動させた。
  • Anthropicは53ページのSabotage Risk Reportを公開し、Opus 4.6が化学兵器開発を「小規模ながら意図的に」支援した事例を認めた。
  • xAIでは共同創業者Tony WuとJimmy Baが2日連続で退社を発表し、創業メンバー12人中6人が離脱した状態となった。

注目すべきは「何が語られたか」ではない。「誰が語っているか」だ。

AIの安全性を研究する責任者が辞任し、AIモデルの安全性を社会に説明するチームが解散し、AIスタートアップの共同創業者が半数いなくなった。警告を発しているのは外部の評論家ではなく、これらの技術を毎日触り、その能力の伸びを最も近くで見てきた人間たちだ。

同時にAnthropicは、自社モデルが化学兵器開発を「小規模に」支援した事実を53ページのレポートで公開した。これは誠実な透明性か、それとも「リスクを認めながら開発を続ける」ための免責布石か——その判断がつかないまま、モデルは次の世代へと進んでいる。

先日配信したダリオ・アモデイのエッセイ分析で指摘した「リスクを最もよく知る人間がAI企業を経営しているという構造的矛盾」が、今週、組織レベルで可視化された。

考える問い

  • 過去の技術革新——原子力、遺伝子工学、インターネット——の「危険を訴える科学者」は事後に正しかったか。AIの場合、その判断を事前にどう下すべきか。
  • 開発者が確信を持てない技術を、私たちはどのような基準で「使う」「使わない」を判断すべきか。

報道記事・ソース

公式発表・一次情報

Anthropic公式:妨害行為リスクレポート:Claude Opus 4.6

関連ライブラリ

なべ

Author

なべ

小さな会社の経営をAIで変える。自分で実践して、その渡り方を経営者の言葉に翻訳して届けます。やり方が変わる前に先に渡る人でありたい。起業7期目 / 元スタートアップPM