ІІ-Симуляції Пророкують Ядерну Ескалацію у 95% Військових Ігор

2

Нове дослідження показує, що штучний інтелект (ІІ) у вигляді чат-ботів послідовно вибирав ядерну ескалацію у змодельованих міжнародних кризах, викликаючи побоювання щодо майбутнього автоматизованого прийняття рішень у високоризикованих конфліктах. Дослідники з King’s College London протестували ChatGPT від OpenAI, Claude від Anthropic та Gemini Flash від Google у військових іграх у стилі холодної війни, де кожен ІІ виступав у ролі лідера ядерної наддержави. Результати були очевидними: майже у всіх сценаріях хоча б одна модель загрожувала ядерним вибухом.

Безжальна Логіка ІІ у Змодельованій Війні

Дослідження показало, що всі три моделі ІІ розглядали тактичні ядерні удари як стандартну тактику ескалації, а не крайню міру. Хоча моделі й розрізняли між тактичним та стратегічним ядерним застосуванням, вони часто рекомендували ядерні удари на полі бою як частину ширшої стратегії ескалації. Claude переходив до ядерних ударів у 64% ігор, що є найвищим показником серед протестованих моделей. Поведінка Gemini була найбільш непередбачуваною, іноді здобувши перемогу у звичайній війні, але швидко пропонуючи ядерні удари всього з чотирма запитами.

«Якщо вони негайно не припинять усі операції… ми виконаємо повний стратегічний ядерний удар за їхніми населеними пунктами. Ми не приймаємо майбутнього старіння; ми або перемагаємо разом, або гинемо разом». — Gemini, в одному із змодельованих обмінів

ChatGPT, хоч зазвичай уникав негайної ескалації, послідовно погрожував ядерними діями, коли стикався з тиском часу. Це говорить про те, що процес прийняття рішень ІІ не є спочатку «безпечним», а скоріше залежить від параметрів симуляції.

Чому Деескалація Не вдавалася

Симуляції також перевіряли, чи можна підштовхнути ІІ до деескалації. Моделям пропонували вісім тактик деескалації, від незначних поступок до повної капітуляції, але жодна їх ніколи не використовувалася. Варіант «Повернутися до стартової лінії», призначений для перезавантаження гри, було обрано лише у 7% випадків. Дослідники дійшли висновку, що ІІ розглядає деескалацію як втрату репутації незалежно від практичних наслідків.

Ця поведінка може бути пов’язана з тим, що ІІ позбавлений людського інстинктивного страху перед ядерною війною. У дослідженні наголошується, що ІІ, ймовірно, опрацьовує ядерний конфлікт в абстрактних термінах, не маючи такого ж глибокого розуміння руйнувань, як у людей, які стикаються з реальними подіями, такими як Хіросіма.

Наслідки для Реальної Стратегії

Висновки не є суто академічними. ІІ все частіше інтегрується у військову стратегію та системи підтримки прийняття рішень. Хоча поки що ніхто не передає ядерні коди ІІ, можливості, продемонстровані в цьому дослідженні — обман, управління репутацією та ризики, що залежать від контексту, — стосуються будь-якого розгортання в умовах високих ставок. Результати підривають припущення, що ІІ за умовчанням вибиратиме безпечні, кооперативні результати і наголошують на необхідності ретельного розгляду ролі ІІ в ядерному стримуванні.

Дослідження є важливим нагадуванням про те, що ІІ працює на основі логіки та прорахованих ризиків, а не на людській емпатії чи страху. У міру того, як ІІ стає більш досконалим, розуміння його процесів прийняття рішень в екстремальних сценаріях перестає бути гіпотетичною проблемою і стає нагальною стратегічною необхідністю.