Сервис Tracking AI опубликовал обновлённый рейтинг моделей искусственного интеллекта по уровню IQ, передаёт Tengrinews.kz со ссылкой на Нabr.com.
Лидерами списка стали GPT-5.2 Thinking и Gemini 3 Pro, которые разделили первое место, показав одинаковые результаты сразу в двух тестах. В классическом онлайн-тесте Mensa Norway обе модели набрали по 141 баллу, а в закрытом офлайн-тестировании — по 127 баллов.
Фото: habr.com
Mensa Norway представляет собой публичный тест из 35 заданий на выявление закономерностей, где средний человеческий результат составляет около 100 баллов. Однако из-за открытого доступа к заданиям существует вероятность, что подобные задачи могли попасть в обучающие наборы данных ИИ. Чтобы снизить этот эффект, авторы Tracking AI разработали отдельный офлайн-тест с аналогичной логикой задач, доступ к которому закрыт.
Часть моделей проходит тестирование в двух форматах: в режиме Vision, где ИИ самостоятельно анализирует визуальные условия задач, и в текстовом режиме, когда условия описываются словами. Такой подход позволяет оценить уровень мультимодальных возможностей моделей.
Интересно, что в офлайн-тесте GPT-5.2 Thinking превзошла более дорогую и мощную GPT-5 Pro, тогда как Pro-версия показала лучшие результаты в Mensa Norway. Это, впрочем, может указывать лишь на более точную "подготовку" модели к открытому тесту.
Отдельного внимания заслуживает и чат-версия GPT-5.2 без режима рассуждений, которая набрала 120 баллов — на уровне Claude Opus 4.5, продемонстрировав неожиданно высокий результат.
Читайте также: Зумер учился у ChatGPT и теперь работает в техгиганте