3 улитки и нейросети, пытающиеся спасти их из колодца
Загадка: Три улитки ползают по дну колодца глубиной 30 метров. За день они поднимаются на 18 метров каждая, но потом сползают вниз:
первая на 12 метров;
вторая на 16 метров;
третья на 17 метров.
Каждая улитка сползает на указанное расстояние за ночь и остаётся там до следующего дня. Через сколько дней улитки смогут выбраться?
-
Всем привет! Продолжим тестировать нейросети на загадках? В прошлой статье победил пользователь: @9229, мужик! Считать в уме - хороший навык.
И да, старичок GPT 3.5 канул в прошлое, сняли его с производства и в оригинале и в апи.
-
Я буду тестировать их:
ChatGPT 4o (OpenAI)
ChatGPT 4o-mini (OpenAI)
Cloud Sonnet 3.5 (от Anthropic)
Copilot (от Майкрософт)
Deepseek (R1)
Yandex GPT
Gemini (от Google)
Телеграм бот
-
ChatGPT 4o (OpenAI)
Нет... Блин, я даже уточнил, но, Bruh. Результат в 2 раза больше правильного.
https://chat.aiacademy.me/share/51b75849931743440659f50c (ссылка на диалог, его можно продолжить и УНИЗИТЬ!! простите 😬)
-
-
ChatGPT 4o-mini (OpenAI)
Ситуация такая же. ИИ берет слишком высоко, диапазон значений тут от 3-х до 13, упс, спойлер.
-
-
Cloud Sonnet 3.7 (от Anthropic)
Ну вы поняли мою реакцию по фото, это прекрасно) Нейросеть решили загадку. Возможно новая версия Клода использует датасеты современней.
-
-
Copilot (от Майкрософт)
Так, черед копилотки.
Мне зашел их дизайн, выглядит круто. Но ответ не не зашел. С глубоким мышлением он и вовсе ушел в глубокую кому.
-
-
Deepseek (R1)
Двоякая задача вышла. Кто-то говорит 30, кто-то 23. Но вы у меня умные, я знаю, вы уже решили, да и в уме)
-
-
Yandex GPT
Так, какая-то уникальность появилась, радует.
-
-
Gemini (от Google)
Да! Мега ответ. Сказал бы я, но нет, дно. Интересную загадку подобрал.
-
-
Телеграм бот
Даже не близко...
-
-
Результаты:
Только одна нейросеть из восьми решила загадку. Вероятность попадания в цель: 12.5%. Остальные нейросети давали разные ответы. Я их сломал, круть. Пишите ваше мнение в комменты, возможно мой источник ненадежен.