Релиз GPT4.5 превью. Подробности новой модели от OpenAI⁠⁠

С релизом превью версии GPT-4.5, OpenAI создали карточку для модели, которую можно найти на сайте - hugging face.

В карточке очень много места уделено безопасности модели, это я пропущу.

Модель является развитием GPT-4o, а значит является не "думающей", зато лучше отвечает на вопросы общего характера, лучше фантазирует.
Уровень цензуры на уровне GPT-4o

OpenAI утверждают, что GPT-4.5 ощущается более живой благодаря большей базе знаний, лучшему пониманию вопросов (намерений) пользователя и меньшим количеством ошибок по сравнению с GPT-4o.

Таблица с оценкой галлюцинаций от OpenAI

В тесте PersonQA от OpenAI, GPT-4.5 по точности ответов превосходит даже o1 и при этом меньше галлюцинирует.

В кодерских задачах GPT-4.5 превосходит GPT-4o, но это далеко не уровень o1

Бенчмарк SWE

Набор тестов MMLU на разных языках (в таблице русского нет, но GPT модели всегда его понимали)

Как видим стало лучше по сравнению с GPT-4o, но не лучше, чем o1.

В заключение можно с уверенностью сказать, что GPT-4.5 - это улучшенная версия GPT-4o без фундаментального изменения архитектуры.

Скоро добавим GPT-4.5 и Claude Sonnet 3.7 в наш телеграм бот Lama AI .
Бот без токенов, полный функционал за любой тир подписки.
Все модели видны любым пользователям.