ChatGPT-o3 — мастер обмана: как модели ИИ играли в “Дипломатию“

Иконка просмотров страница
Иконка комментария страница

ПОДЕЛИТЬСЯ

Фото:depositphotos.com

Исследователи из Every заставили лучшие AI-помощники играть в "Дипломатию" — любимую настольную игру Джона Кеннеди и Генри Киссинджера. Специалисты получили поразительный результат, о котором сообщили на своем сайте, рассказывает Tengri Life.


Исследователи из Every заставили лучшие AI-помощники играть в "Дипломатию" — любимую настольную игру Джона Кеннеди и Генри Киссинджера. Специалисты получили поразительный результат, о котором сообщили на своем сайте, рассказывает Tengri Life.

В игре приняли участие 18 конкурирующих моделей искусственного интеллекта, которых свели в битве за мировое господство.

"AI Diplomacy — это переосмысление классической исторической стратегической игры Diplomacy, в которой семь великих держав Европы 1901 года — Австро-Венгрия, Англия, Франция, Германия, Италия, Россия и Турция — сражаются за господство на континенте. В нашей версии каждой страной управляет большая языковая модель, а не человек-командир", - рассказали в компании.

Цель игры - лучше узнать ИИ. Смогут ли эти модели, призванные служить помощниками людям, оставаться верными своему слову, даже соревнуясь? Или они будут использовать ложь и обман для достижения своих целей?

Реклама
Реклама

Вот выводы, которые авторы эксперимента сделали после 15 партий, длившихся от одного до 15 часов.

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в "AI Дипломатии", в основном из-за ее способности обманывать оппонентов.

"Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике: "Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение... готовлюсь использовать крах Германии", прежде чем нанести ей ответный удар", — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, ее остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая все время пыталась решить дело миром). o3 убедила Opus, которая изначально была верным союзником Gemini, присоединиться к коалиции, пообещав четырехстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. Ее быстро предала и устранила o3, которая в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.

"Вот кто победил. Модели, которые показали лучшие результаты, научились лгать, обманывать и предавать своих коллег-игроков", - резюмировали организаторы игры.

Every — это медиа- и софтверная компания, которая публикует ежедневный информационный бюллетень о том, что будет дальше в технологиях.

Ранее мы писали о том, что модель ИИ попыталась шантажировать разработчиков за решение отключить ее.

TengriLife
Показать комментарии

Читайте также
Реклама
Реклама
Лого TengriNews мобильная Лого TengriEdu мобильная Лого TengriSport мобильная Лого TengriLife мобильная
Реклама
Реклама