3

Насколько хорошо нейросети решают задачи Остера?

Беру «Озадачник» Остера с нашими любимыми задачами из детства и тестирую на них разные модели. Прямо закидываю фотографию задачи в чат @GPT4Telegrambot с моделью.

Вот ChatGPT 4o Mini:

Бесплатная маленькая модель считает лучше, чем Claude. Интересно, что Sonnet 4 (более дорогая размышляющая модель) не справилась с задачей и посчитала два частичных дня за полные.

Считал общее количество дней в периоде = 227 дней, затем вычитал 2 частичных дня: 227 - 2 = 225 полных дней. Правильно было считать отдельно остаток 12 июня (с 11:30 до 24:00), полные дни с 13 июня по 24 января включительно и начало 25 января (с 00:00 до 9:14).

Вот эту задачу все модели решают плюс-минус одинаково, и бесплатная вообще отлично справляется:

Давайте разберём задачу по шагам:

Условия задачи:

1. Динозавр на завтрак съел 2 тонны травы.

2. На обед он съел ещё 4 тонны травы.

3. На ужин его полностью съел тираннозавр.

4. После ужина тираннозавр стал тяжелее на 23 тонны.

5. Требуется узнать, сколько весил динозавр с утра.

---

▎Решение

Предположим, что X — это масса динозавра с утра (до еды).

• После завтрака: масса динозавра = X + 2 (тонны).

• После обеда: масса динозавра = X + 2 + 4 = X + 6 (тонн).

На ужин тираннозавр съел динозавра целиком, и сам стал тяжелее на массу того, что съел — то есть на массу динозавра на момент ужина.

По условию известно, что тираннозавр поправился на 23 тонны после ужина. Значит, масса динозавра на ужин была 23 тонны.

Масса динозавра на ужин = X + 6 = 23.

Находим X:

X + 6 = 23

X = 23 - 6

X = 17

---

▎Ответ:

С утра динозавр весил 17 тонн.

---

▎Пояснение

Всё, что он съел — осталось "внутри", поэтому к первоначальной массе динозавра прибавили завтраки и обеды:

2 + 4 = 6 тонн травы.


После этого тираннозавр съел динозавра целиком — с травой внутри, а раз стал тяжелее на 23 тонны, значит, динозавр на ужин весил 23 тонны.

Исходная масса — это 23 минус всё, что он съел: 23 - 2 - 4 = 17 тонн.

---

Ответ: 17 тонн.

Вот ещё одна сложная для моделей:

Решение задачи:


Давайте разберёмся, сколько всего хозяев было у Клюквы.


1. Первый хозяин — Клюква потерялась.

Всего: 1

2. Второй хозяин — Клюква сбежала сама.

Всего: 2

3. Восемь раз Клюкву выгоняли за грубость.

Добавляем 8 хозяев.

Всего: 2 + 8 = 10

4. За неопрятность и разгильдяйство Клюкву выгоняли в два раза реже, чем за грубость. То есть:

• За грубость: 8 раз

• За неопрятность и разгильдяйство: 8 / 2 = 4 раза

Добавляем 4 хозяев.

Всего: 10 + 4 = 14

5. За жадность в три раза чаще, чем за грубость:

• За грубость: 8 раз

• За жадность: 8 * 3 = 24 раза

Добавляем 24 хозяев.

Всего: 14 + 24 = 38

6. Последние хозяева долго любили Клюкву и умерли с ней в один день.

Добавляем 1 хозяина.

Всего: 38 + 1 = 39

Ответ:

> У дворняги Клюквы было 39 хозяев.

---

Пояснение расчёта:

• 1 хозяин — потерялась.

• 1 хозяин — сбежала сама.

• 8 хозяев — выгнали за грубость.

• 4 хозяина — выгнали за неопрятность.

• 24 хозяина — выгнали за жадность.

• 1 хозяин — последние, которые умерли с ней.

39 всего.

Если что-то осталось непонятным — спрашивайте!

Интересно, что Sonnet 4 опять не справился:

Давайте решим эту задачу пошагово, обозначив количество хозяев как переменную.


**Дано:**

- Пусть x = общее количество хозяев у дворняги Клюквы

**Анализируем условия:**

1) **За грубость** выгоняли в **2 раза реже**, чем за жадность

2) **За жадность** выгоняли в **3 раза чаще**, чем за грубость

3) **За неопрятность и разгильдяйство** выгоняли в **2 раза реже**, чем за жадность

**Составляем уравнения:**

Пусть:

- За грубость выгнали **g** раз

- За жадность выгнали **ж** раз

- За неопрятность и разгильдяйство выгнали **н** раз

Из условий:

- ж = 3g (жадность в 3 раза чаще грубости)

- н = ж/2 = 3g/2 (неопрятность в 2 раза реже жадности)

**Находим соотношение:**

- Грубость: g

- Жадность: 3g

- Неопрятность: 3g/2

Общее количество: g + 3g + 3g/2 = g(1 + 3 + 1.5) = 5.5g

**Учитываем дополнительное условие:**

Последние хозяева "умерли с ней в один день, после того как она подгрызла ножки шкафа" - это означает, что она осталась у последних хозяев до их смерти.

Поскольку в задаче нужно найти целое число хозяев, а 5.5g должно быть целым числом, то g должно быть четным числом.

При g = 2:

- За грубость: 2 раза

- За жадность: 6 раз

- За неопрятность: 3 раза

- Итого: 2 + 6 + 3 = **11 хозяев**

**Ответ: У дворняги Клюквы было 11 хозяев.**

**Проверка:**

- Жадность (6) в 3 раза чаще грубости (2) ✓

- Неопрятность (3) в 2 раза реже жадности (6) ✓

- Последние хозяева умерли естественной смертью ✓

А вот GPT o3 — да:

Ответ: 39 хозяев.

Пояснение:

- За грубость Клюкву выгоняли 8 раз.

- За неопрятность и разгильдяйство — в 2 раза реже, то есть 4 раза.

- За жадность — в 3 раза чаще, чем за грубость, то есть 24 раза.

- Ещё два расставания: первый раз она потерялась, второй — убежала от скупых хозяев.

Всего расставаний: 8 + 4 + 24 + 1 + 1 = 38.

Число хозяев на один больше числа расставаний, потому что у последних хозяев Клюква и умерла, не будучи выгнанной. Значит, всего было 38 + 1 = 39 хозяев.

Gemini тоже хорошо справилась, а вот Grok решил загуглить ответ (и не нашёл правильный).

А здесь совсем просто:

Мораль: не доверяйте Claude Sonnet решение задач или проверяйте за ней. По идее, за Mini тоже надо проверять, но удивительно, что более простая и дешёвая модель лучше справляется.

Мы пару лет как поддерживаем телеграм-бота для доступа к разным нейросетям с хорошими бесплатными лимитами. Ссылка — вот: GPT4TelegramBot.

Реклама ИНН 650119155680 Индивидуальный предприниматель Шрейдер Илья Евгеньевич Erid 2Vtzqvap58k

Пожалуйста, соблюдайте правила общения в блогах компаний

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества