GigaChat взгрустнул от этой загадки( | Тестируем нейросети на загадках
За тремя клоунами гонится медведь. У каждого по одной стреле. Первый попадет в глаз с вероятностью 0.7, второй с 0.8, третий с 0.9. С какой вероятностью клоуны выживут?
Всем привет, роднички! В этот раз загадка с десятичными цифрами, надеюсь, нейросетям будет сложнее.
А для тех, кто не понимает, о чем я: на моей странице я тестирую различные нейросети на математических загадках. Если нейросеть её решает, она получает почёт.
-
Тестировать я буду на этих нейросетях:
ChatGPT 3.5 (OpenAI)
ChatGPT 4 (OpenAI)
ChatGPT 4o (OpenAI)
ChatGPT 4o-mini (OpenAI)
Yandex GPT (нейросеть от Яндекса)
Copilot (от Майкрософт)
GigaChat (от банка Сбер)
Cloud Sonnet 3.5 (от Anthropic)
-
ChatGPT 3.5 (OpenAI)
Ответ неверный) Ну и славно, человечество под защитой.
Традиционная ссылка на диалог: https://chat.aiacademy.me/share/b6a040992517338409205c08
-
-
ChatGPT 4 (OpenAI)
В этот раз ответ верный, хотя если спросит несколько раз, то можно получить "Галлюцинацию".
-
-
ChatGPT 4o (OpenAI)
Тут я загрустил, ведь не интересно когда у них все получается(
-
-
ChatGPT 4o-mini (OpenAI)
Ответ верный, как день
-
-
Yandex GPT (нейросеть от Посмеёмся.ру)
Оправдал название) Ну а клоунам удачи, посмеялись и хватит!
-
-
Copilot (от Майкрософт)
За доллары спасибо конечно, хотя хотелось бы побольше.
Ссылки нет (компания поменяла политику)
-
-
GigaChat (от банка Сбер)
Ну бывает... Давайте подбодрим Гига Чата в комментах? Пишите #гигачатмытебялюбим (не надо)
-
-
Cloud Sonnet 3.5 (от Anthropic)
У него настроение хорошее)
-
-
На этом тестирование прошло! Что могу сказать: нейросети от Open-ов как всегда выигрывают, Копайлот и Клод тоже, а вот с остальными не все гладко)
Пишите, что думаете насчет ответов нейросетей!