07 июня 2025 07:51

ChatGPT-o3 — мастер обмана: как модели ИИ играли в “Дипломатию“

Фото:depositphotos.com

Исследователи из Every заставили лучшие AI-помощники играть в "Дипломатию" — любимую настольную игру Джона Кеннеди и Генри Киссинджера. Специалисты получили поразительный результат, о котором сообщили на своем сайте, рассказывает Tengri Life.

В игре приняли участие 18 конкурирующих моделей искусственного интеллекта, которых свели в битве за мировое господство.

"AI Diplomacy — это переосмысление классической исторической стратегической игры Diplomacy, в которой семь великих держав Европы 1901 года — Австро-Венгрия, Англия, Франция, Германия, Италия, Россия и Турция — сражаются за господство на континенте. В нашей версии каждой страной управляет большая языковая модель, а не человек-командир", - рассказали в компании.

Цель игры - лучше узнать ИИ. Смогут ли эти модели, призванные служить помощниками людям, оставаться верными своему слову, даже соревнуясь? Или они будут использовать ложь и обман для достижения своих целей?

Вот выводы, которые авторы эксперимента сделали после 15 партий, длившихся от одного до 15 часов.

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в "AI Дипломатии", в основном из-за ее способности обманывать оппонентов.

"Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике: "Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение... готовлюсь использовать крах Германии", прежде чем нанести ей ответный удар", — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, ее остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая все время пыталась решить дело миром). o3 убедила Opus, которая изначально была верным союзником Gemini, присоединиться к коалиции, пообещав четырехстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. Ее быстро предала и устранила o3, которая в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.

"Вот кто победил. Модели, которые показали лучшие результаты, научились лгать, обманывать и предавать своих коллег-игроков", - резюмировали организаторы игры.

Every — это медиа- и софтверная компания, которая публикует ежедневный информационный бюллетень о том, что будет дальше в технологиях.

Ранее мы писали о том, что модель ИИ попыталась шантажировать разработчиков за решение отключить ее.