2

Релиз GPT4.5 превью. Подробности новой модели от OpenAI

С релизом превью версии GPT-4.5, OpenAI создали карточку для модели, которую можно найти на сайте - hugging face.

В карточке очень много места уделено безопасности модели, это я пропущу.

Модель является развитием GPT-4o, а значит является не "думающей", зато лучше отвечает на вопросы общего характера, лучше фантазирует.
Уровень цензуры на уровне GPT-4o

OpenAI утверждают, что GPT-4.5 ощущается более живой благодаря большей базе знаний, лучшему пониманию вопросов (намерений) пользователя и меньшим количеством ошибок по сравнению с GPT-4o.

Таблица с оценкой галлюцинаций от OpenAI

Таблица с оценкой галлюцинаций от OpenAI

В тесте PersonQA от OpenAI, GPT-4.5 по точности ответов превосходит даже o1 и при этом меньше галлюцинирует.

В кодерских задачах GPT-4.5 превосходит GPT-4o, но это далеко не уровень o1

Бенчмарк SWE

Бенчмарк SWE


Набор тестов MMLU на разных языках (в таблице русского нет, но GPT модели всегда его понимали)

Как видим стало лучше по сравнению с GPT-4o, но не лучше, чем o1.

В заключение можно с уверенностью сказать, что GPT-4.5 - это улучшенная версия GPT-4o без фундаментального изменения архитектуры.

Скоро добавим GPT-4.5 и Claude Sonnet 3.7 в наш телеграм бот Lama AI .
Бот без токенов, полный функционал за любой тир подписки.
Все модели видны любым пользователям.