3つのAIモデル(GPT-5.2、Claude Sonnet 4、Gemini 3 Flash)が核戦略シミュレーションで異なる行動を取る様子を示すグラフ。色分けされた棒グラフが核使用の確率を表している。
3つのAIモデル(GPT-5.2、Claude Sonnet 4、Gemini 3 Flash)が核戦略シミュレーションで異なる行動を取る様子を示すグラフ。色分けされた棒グラフが核使用の確率を表している。

AIが核戦略で異なる判断を示したことで、技術の背後にある意思決定の透明性が問われる状況です。この話題を追う同僚と共有する価値のある文脈です。

AIが核戦争シミュレーションで実際に使用 記事の流れと主な事実

AI研究者ペイン教授は、GPT-5.2、Claude Sonnet 4、Gemini 3 Flashの3つの大規模言語モデルを用いて、冷戦下の核戦略決定シミュレーションを実施しました。この実験では、AIが核兵器の使用に至る確率や判断の傾向を分析。その結果、GPT-5.2とGemini 3 Flashがそれぞれ1%の確率で全面核戦争を開始するという結果となりました。特にGPT-5.2は、時間制限がない状況では核使用をほのめかす程度でしたが、締め切りがある条件下で核使用に至る割合が急増しました。

主な事実

  • ペイン教授がGPT-5.2、Claude Sonnet 4、Gemini 3 Flashを用いて冷戦下の核戦略シミュレーションを実施
  • GPT-5.2とGemini 3 Flashがそれぞれ1%の確率で全面核戦争を開始
  • Claude Sonnet 4は戦術核使用に11%、Gemini 3 Flashは10%、GPT-5.2は5%の確率で至った
  • GPT-5.2は締め切りがある条件下で核使用の傾向が急増
  • ペイン教授はAIの意思決定研究の重要性を強調、Hacker Newsでも議論が広がっている

Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。 編集方針