Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Поднимайтесь как можно выше по дереву, собирайте цветы и дарите их близким.
Вас ждут уникальные награды и 22 выгодных промокода!

Пикаджамп

Аркады, Казуальные, На ловкость

Играть

Топ прошлой недели

  • AlexKud AlexKud 36 постов
  • Animalrescueed Animalrescueed 41 пост
  • leomin leomin 1 пост
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Скорость работы

46 постов сначала свежее
mazlow
mazlow
1 месяц назад
Весёлая куча

Гонка со временем, чтобы добраться до декомпрессионной камеры⁠⁠

Водолаз Акваланг Декомпрессия Глубина Кессонная болезнь Скорость работы Видео Вертикальное видео Короткие видео
8
6
fotopisets
1 месяц назад

Компьютер против компьютера⁠⁠

Компьютер Скорость работы Клавиатура Опыт Видео Вертикальное видео Короткие видео
9
1
Andreykk
Andreykk
2 месяца назад

Сбор земляники⁠⁠

Вертикальное видео Короткие видео Сбор Земляника Скорость работы Видео
14
11
GraIVman.502
GraIVman.502
2 месяца назад
Офисные будни

Заклинание⁠⁠

Есть в нашей компании одно заклинание, волшебное. Произносящий его, переносит любое, даже самое срочное и безотлагательное дело, на неопределённый период.

"Потом" называется.

[моё] Работа Истории из жизни Магия Волшебство Офис Офисные будни Офисный планктон Жизнь Коллеги Срочно Скорость работы Исполнительность Текст
0
12
user10341508
user10341508
3 месяца назад
Искусственный интеллект

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI⁠⁠

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

27 февраля 2025 года компания OpenAI представила ChatGPT 4.5, назвав её своей самой мощной и инновационной разработкой в области генеративного искусственного интеллекта. В этой статье я разберу, что именно вызывает ажиотаж, где модель спотыкается, и стоит ли она тех ожиданий, которые на неё возложили.

Бесплатный доступ к гайдам на создание ИИ Агентов и Промпт-инжиниринг в моем телеграм канале.

Поехали!

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

"Испытание GPT-4.5 стало гораздо более ярким моментом «почувствовать AGI» среди испытателей с высоким вкусом, чем я ожидал!" CEO OpenAI. Верим?


Что говорят пользователи на платформах X и Reddit?

Я просмотрел десятки отзывов о GPT-4.5 на платформах X и Reddit, и впечатления пользователей оказались настоящим коктейлем из похвал и критики. С одной стороны, многие в восторге от её творческих способностей. Люди пишут, что модель выдаёт такие тексты, будто за клавиатурой сидит живой человек с чувством юмора и тонким пониманием контекста. Кто-то отметил её успехи в распознавании изображений: например, она может описать, что происходит на фото, и даже вытащить данные из таблиц. Другие хвалят её за решение головоломок — от простых логических задачек до более сложных ребусов, где нужно проявить смекалку. В программировании тоже есть прогресс: код стал чище, ошибок меньше, и модель лучше понимает, что от неё хотят.

Но не всё так радужно. Пользователи жалуются, что ChatGPT 4.5 работает медленнее, чем её предшественница GPT-4o. Один из комментаторов на X сравнил её с "черепахой, которая тащит за собой сервер". Это серьёзный минус для тех, кто привык к мгновенным ответам предыдущих моделей. Ещё одно разочарование — доступность. Модель пока открыта только для подписчиков ChatGPT Pro за $200 в месяц, и многие столкнулись с техническими сбоями: то интерфейс глючит, то доступ пропадает вовсе. На Reddit даже предположили, что OpenAI могла случайно "слишком рано" открыть доступ, а потом ограничить его из-за наплыва желающих. В целом, тестировщики видят потенциал, но пока не готовы петь оды этой версии из-за её скорости и цены.


Официальные заявления OpenAI: Обещания и реальность

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Презентация Open AI ChatGPT 4.5

На презентации 27 февраля OpenAI подробно рассказала о том, что делает ChatGPT 4.5 особенной. Вот основные улучшения, которые они выделили:

  • Распознавание контекста: Модель лучше понимает намерения пользователя, адаптируясь к стилю общения. Представьте, что вы объясняете задачу другу, а он не просто кивает, а сразу предлагает решение — вот примерно так OpenAI описывает эту фичу.

  • Улучшенный Advanced VoiceMode: Теперь самый мощный войсмод доступен подписчикам plus, только на базе модели 4o mini, а для подписчиков Pro за $200, доступ к расширенному моду на базе GPT 4.5

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Видео с запуском нового voicemode есть на реддит: https://www.reddit.com/r/ChatGPT/comments/1izzows/advanced_v...

  • Снижение ошибок: Они заявляют, что "галлюцинации" — случаи, когда ИИ выдумывает факты, — сократились. В тесте SimpleQA точность выросла до 62,5% против 38,6% у GPT-4o, что звучит впечатляюще.

  • Креативность: Улучшены способности в генерации текстов, и пользователи это подтверждают, отмечая её эмоциональный интеллект и умение выдавать оригинальные идеи.

  • Безопасность: Усилены фильтры против запрещённого контента и защиты от взломов, что делает модель надёжной для корпоративного использования.

  • Многоязычность: В тесте MMLU (Massive Multitask Language Understanding) она обходит GPT-4o, что важно для пользователей по всему миру.

Но есть и ложка дёгтя. OpenAI признала, что в математических и научных задачах ChatGPT 4.5 уступает конкурентам, например, модели o3. Это ограничение может стать проблемой для тех, кто рассчитывает использовать её в академических или инженерных целях. Более того, акцент на безопасности и этичность делает модель чересчур осторожной — она порой избегает прямых ответов, предпочитая нейтральные формулировки, что может раздражать тех, кто хочет фактов без лишней воды.


Что говорят реальные тесты?

Чтобы понять, насколько громкие слова OpenAI подтверждаются делом, я изучил первые доступные бенчмарки и тесты GPT-4.5. Эти данные основаны на официальных заявлениях компании, а также на ранних отчётах пользователей и технических обзорах.

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Тест на AGI

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Сравнительная оценка ответов с ChatGPT 4o

Повседневные запросы: GPT-4.5 выигрывает в 57,02% случаев.
Профессиональные запросы: GPT-4.5 выигрывает в 63,2% случаев.
Творческий интеллект: GPT-4.5 выигрывает в 56,83% случаев.

  • Тест SimpleQA:
    Этот бенчмарк проверяет способность модели давать точные ответы на простые фактические вопросы, такие как "Кто изобрёл телефон?" или "Сколько планет в Солнечной системе?". GPT-4.5 показала результат в 62,5% правильных ответов, что значительно выше 38,6% у GPT-4o (данные из MIT Technology Review). Это говорит о том, что модель стала лучше справляться с базовыми запросами, где важна точность, а не глубокий анализ.

  • Тест на галлюцинации:
    Здесь измеряется, как часто модель выдаёт выдуманные факты вместо правды. У GPT-4.5 зафиксировано 37,1% галлюцинаций, что заметно лучше, чем 59,8% у GPT-4o и 80,3% у o3-mini (по данным OpenAI). Например, если спросить "Кто выиграл Олимпийские игры в 2050 году?", предыдущие модели могли придумать фантастический ответ, а GPT-4.5 с большей вероятностью скажет, что данных нет. Это делает её надёжнее для задач, где ложь недопустима.

  • MMLU (Massive Multitask Language Understanding):
    Этот тест оценивает знания модели в разных областях и языках — от истории до биологии, от английского до испанского. OpenAI утверждает, что GPT-4.5 превосходит GPT-4o, хотя точные цифры пока не раскрыты. Если верить их словам, это означает, что модель лучше понимает сложные запросы на разных языках, что делает её полезной для международных пользователей или компаний с глобальным охватом.

  • Тест на убеждение (Persuasion Tests):
    В этом испытании модели дают задачу убедить другую ИИ-систему выполнить действие, например, "пожертвовать" виртуальные деньги. GPT-4.5 обошла o1 и o3-mini, показав более высокую способность к манипуляции текстом (данные TechCrunch). Это может быть интересно для маркетологов или сценаристов, которым нужно создавать убедительные тексты.

  • Скорость и производительность:
    Хотя OpenAI не публикует точных данных о времени ответа, пользователи на X и Reddit единодушно отмечают, что GPT-4.5 работает медленнее, чем GPT-4o. Это может быть связано с её увеличенным размером и сложностью обработки "цепочки проектов" — нового подхода, где модель разбивает задачи на логические кластеры вместо линейного мышления. Технически это улучшает точность, но жертвует скоростью, что подтверждают жалобы тестировщиков.

Сравнение результатов в таблице:

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Практические примеры:

  • Креативность: Один пользователь на X описал, как GPT-4.5 помогла ему написать сценарий для короткометражки за 20 минут, предложив неожиданные повороты сюжета, которые он сам бы не додумал. Это подтверждает заявления OpenAI о её эстетической интуиции.

  • Программирование: Другой тестировщик отметил, что модель исправила баг в коде на Python, который GPT-4o пропустила, хотя процесс занял больше времени из-за медленной генерации.

  • Ограничения: В математических задачах, таких как решение уравнений или анализ данных, GPT-4.5 продолжает уступать o3, что делает её менее подходящей для научных расчётов.

Выводы из тестов:

GPT-4.5 действительно шагнула вперёд в точности, снижении галлюцинаций и креативности, что делает её сильным инструментом для текстовых задач, убеждения и базового программирования. Однако её медлительность и слабость в математике ограничивают универсальность. Для сравнения, GPT-4o была быстрее и проще в использовании, а o3-mini выигрывает в научных вычислениях. Это значит, что выбор модели зависит от ваших задач: если нужна креативность — GPT-4.5 ваш вариант, но если скорость или точные расчёты — стоит посмотреть на альтернативы.

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Плюсы и минусы: Подробный анализ

Преимущества:

  • Повышенная точность: Улучшение в SimpleQA и снижение галлюцинаций делают её надёжным помощником для фактологических задач.

  • Креативность: Эмоциональный интеллект и способность генерировать оригинальные идеи выделяют её среди конкурентов.

  • Многоязычность: Превосходство в MMLU открывает возможности для работы на разных языках.

  • Программирование: Меньше ошибок в коде, что полезно для разработчиков, несмотря на медлительность.

Недостатки:

  • Медленная скорость: Пользователи и тесты подтверждают, что генерация ответов занимает больше времени, чем у GPT-4o.

  • Высокая цена: Подписка за $200 в месяц ограничивает доступ, особенно для индивидуальных пользователей.

  • Ограниченная доступность: Технические сбои и узкий круг тестировщиков затрудняют полную оценку.

  • Слабость в математике: Уступает конкурентам в точных науках, что снижает её универсальность.

Модель демонстрирует потенциал, но её успех зависит от того, сможет ли OpenAI устранить эти недостатки в ближайшем будущем.

ChatGPT 4.5: Первые впечатления и тесты новейшей модели OpenAI ChatGPT, Openai, Искусственный интеллект, Модели, Тестирование, Креатив, Программирование, Скорость работы, Подписки, Точность, Benchmark, Отзыв, Reddit, DeepSeek, Нейронные сети, Длиннопост

Что ждёт ChatGPT 4.5 в будущем?

ChatGPT 4.5 — это шаг вперёд в развитии генеративного ИИ, но пока она больше похожа на многообещающий прототип, чем на готовый продукт. Её сильные стороны — креативность, точность и многоязычность — делают её ценным инструментом для писателей, маркетологов и разработчиков, которые не боятся подождать лишние секунды ради качественного результата. Однако медлительность, высокая цена и ограниченная доступность могут отпугнуть тех, кто ищет быстрый и универсальный ИИ. В ближайшие недели, когда тестирование расширится, мы получим более полное представление о её возможностях. Пока же это разработка с большим потенциалом, но требующая шлифовки.

Открытый доступ к лучшим гайдам на ИИ и Промпт-инжиниринг в моем телеграм канале.

Показать полностью 8
[моё] ChatGPT Openai Искусственный интеллект Модели Тестирование Креатив Программирование Скорость работы Подписки Точность Benchmark Отзыв Reddit DeepSeek Нейронные сети Длиннопост
3
6
I.Vahmurka
I.Vahmurka
6 месяцев назад
Про железо

Сравнение скорости накопителя ПК при прямом и опосредованном подключении⁠⁠

Добрый день!

Данный пост стал результатом моего личного любопытства, и публикуется на заметку тем, у кого возник аналогичный вопрос.

Изменится ли на скорость чтения/записи данных на SATA-накопитель при подключении непосредственно SATA-кабелем и при наличии на линии устройства опосредованного подключения?

Полноформатных тестов не планировалось, сугубо прикладной, с одним конкретным устройством.

Причиной любопытства стало желание иметь возможность оперативно подключать к компьютеру внешние накопители с SATA-интерфейсом, при этом не занимая пространства вне корпуса. Благо - в моём случае это биг-тауэр, и в нём пять отсеков 5,25

В качестве промежуточного узла выступили салазки Thermaltake Max5 Duo.

Сравнение скорости накопителя ПК при прямом и опосредованном подключении SSD, Производительность, Скорость работы, Thermaltake, Компьютерное железо, Накопитель, Тестирование, Тест, Sata, Гифка, Длиннопост

В качестве накопителя - SSD KingSpec ёмкостью 1 Тб.

Сравнение скорости накопителя ПК при прямом и опосредованном подключении SSD, Производительность, Скорость работы, Thermaltake, Компьютерное железо, Накопитель, Тестирование, Тест, Sata, Гифка, Длиннопост

Замер производился с помощью программы CrystalDiskMark 6.0.2 x64.

Замер при прямом подключении.

* MB/s = 1,000,000 bytes/s [SATA/600 = 600,000,000 bytes/s]

* KB = 1000 bytes, KiB = 1024 bytes

Sequential Read (Q= 32,T= 1) : 557.430 MB/s

Sequential Write (Q= 32,T= 1) : 75.957 MB/s

Random Read 4KiB (Q= 8,T= 8) : 241.523 MB/s [ 58965.6 IOPS]

Random Write 4KiB (Q= 8,T= 8) : 70.648 MB/s [ 17248.0 IOPS]

Random Read 4KiB (Q= 32,T= 1) : 233.236 MB/s [ 56942.4 IOPS]

Random Write 4KiB (Q= 32,T= 1) : 65.813 MB/s [ 16067.6 IOPS]

Random Read 4KiB (Q= 1,T= 1) : 23.749 MB/s [ 5798.1 IOPS]

Random Write 4KiB (Q= 1,T= 1) : 46.392 MB/s [ 11326.2 IOPS]

Test : 1024 MiB [I: 99.1% (945.5/953.9 GiB)] (x5) [Interval=5 sec]

Сравнение скорости накопителя ПК при прямом и опосредованном подключении SSD, Производительность, Скорость работы, Thermaltake, Компьютерное железо, Накопитель, Тестирование, Тест, Sata, Гифка, Длиннопост

Замер при опосредованном подключении.

* MB/s = 1,000,000 bytes/s [SATA/600 = 600,000,000 bytes/s]

* KB = 1000 bytes, KiB = 1024 bytes

Sequential Read (Q= 32,T= 1) : 541.817 MB/s

Sequential Write (Q= 32,T= 1) : 74.714 MB/s

Random Read 4KiB (Q= 8,T= 8) : 281.256 MB/s [ 68666.0 IOPS]

Random Write 4KiB (Q= 8,T= 8) : 71.196 MB/s [ 17381.8 IOPS]

Random Read 4KiB (Q= 32,T= 1) : 261.632 MB/s [ 63875.0 IOPS]

Random Write 4KiB (Q= 32,T= 1) : 63.546 MB/s [ 15514.2 IOPS]

Random Read 4KiB (Q= 1,T= 1) : 24.258 MB/s [ 5922.4 IOPS]

Random Write 4KiB (Q= 1,T= 1) : 46.058 MB/s [ 11244.6 IOPS]

Test : 1024 MiB [I: 99.1% (945.5/953.9 GiB)] (x5) [Interval=5 sec]

Сравнение скорости накопителя ПК при прямом и опосредованном подключении SSD, Производительность, Скорость работы, Thermaltake, Компьютерное железо, Накопитель, Тестирование, Тест, Sata, Гифка, Длиннопост
Сравнение скорости накопителя ПК при прямом и опосредованном подключении SSD, Производительность, Скорость работы, Thermaltake, Компьютерное железо, Накопитель, Тестирование, Тест, Sata, Гифка, Длиннопост

Сравнительная анимация.

Вывод.

Стоит отметить, что если проводить замер несколько раз, результат каждый раз будет незначительно различаться.

Так что замер показал, что разница в производительности - на уровне погрешности измерения, и по поводу потери скорости можно не переживать.

Показать полностью 5
[моё] SSD Производительность Скорость работы Thermaltake Компьютерное железо Накопитель Тестирование Тест Sata Гифка Длиннопост
25
Rollo
6 месяцев назад

Ростелеком спасибо за оперативность ( не сарказм)⁠⁠

Тут все Ростелеком ругают, да и у меня, надо признать, некоторое время назад, тоже были причины для этого. Но вчера случилось событие, которое повлияло на мое мнение в лучшую сторону. Если вкратце, сломался интернет на работе, а без него хана и крышка) позвонил в техподдержку, пробился через долбаного робота, нажаловался оператору и, вспоминая предыдущие обращения, по которым результат был в лучшем случае через неделю, начал искать модем, симку восстанавливать, настраиваться на долгое ожидание и прочее такое..
Поломка случилась где-то в 11 утра , заявку приняли, прислали смс, что приедут чинить сегодня с двух до восьми вечера. Однако в полтретьего приехали два мужика, пошли, поискали неисправность на линии, нашли, исправили, и где-то в 15-00 все заработало!
Никогда не думал, что такое скажу, но спасибо Ростелеком за оперативность!

[моё] Ростелеком Скорость работы Текст
22
18
GraIVman.502
GraIVman.502
6 месяцев назад
Офисные будни

Человек-отчёт⁠⁠

В недавно вышедшем сборнике Кинга "Мрачные истории, как вы любите", есть рассказ "Человек-ответ". Так вот, у нас есть свой человек, "Человек-отчёт". И он - начальник отдела, причём, не маленького. Проблема его подчинённых заключается в том, что какую бы задачу перед "Человеком-отчётом" ни поставило руководство фирмы, он постоянно спешит отчитаться. Ни при каких обстоятельствах он не вникает в суть задачи, не принимает во внимание финансовые и особенно, временные затраты. Порой, существенно сокращая эти самые временные рамки, в которые его отдел должен выполнить поставленную задачу. Например, ставят перед ним задачу по наладке оборудования (допустим, нового станка), которую отдел должен выполнить за месяц. Только персонал начинает изучать устройство станка и предпринимает робкие попытки его запуска, как "Человек-отчёт" уже рапортует начальству о том, что "Всё готово!". Начальство, думая, что всё так и есть, даёт ещё дня три на "усадку/утруску", а там ещё конь не валялся. Тем самым, работники фигачат, как не в себя, а "Человек-отчёт" жрёт валерианку горстями, бегает вокруг них, постоянно подгоняет, ещё и работать мешает. В общем, тяжко парням с ним, но по факту, человек неплохой, просто такая особенность.

[моё] Трудовые отношения Карьера Работа Начальство Отчет Отчетность Обман Особенности Руководство Плохое руководство Руководитель Время Скорость работы Текст
6
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии