alexmerrys

alexmerrys

Привет! Меня зову Александр Череповский. Я пишу интересные статьи, посты на тему диджитал и не только.
Пикабушник
337 рейтинг 16 подписчиков 9 подписок 86 постов 0 в горячем
1

Можно ли с помощью Telegram бота решать математику?

Всем доброго времени суток, друзья.

Эта статья посвящена тем, кто сталкивается с математикой в своей жизни, так или иначе. Я проведу небольшое независимое исследование и выясню: стоит ли использовать ChatGPT в Телеграме или лучше туда не лезть!

Почему статья на эту тему? Потому что иногда пугает тот факт, что около 2.000.000 человек в России доверяют нейросети в Телеграме. Это как лотерея. Можно получить плохой результат: тройку на экзамене, дезинформацию и сгоревшую еду. Или хороший: полезную информацию, ответ на любой вопрос или даже душевную поддержку. 😌

Возможно, кого-то на 100% устраивают ответы нейросети в Телеграме, но все-таки я сравню Телеграм-бота и оригинальную модель ChatGPT. Затрону математику, она объективна, так как ответ четкий.

-

Загадка 1:

Гуси шли на водопой гуськом (один вслед за другим). Один гусь посмотрел вперёд – перед ним 15 голов. Посмотрел назад – за ним 30 лап. Сколько гусей шло на водопой?

-

ChatGPT в Телеграм:

-

Оригинальный ChatGPT: (точнее сервис с API, оригу разблокировать дорого)

Итог: Правильный ответ за оригиналом - 31.
Так не всегда, ответ зависит от задачи. Если информация (ответ на вопрос) есть в интернете - верный ответ, а если ее нет - неверный.

-

Загадка 2:

log5(8-x)=log9(8-x)

-

ChatGPT в Телеграм:

-

Оригинальный ChatGPT:

-

Итог: побеждает оригинальная модель, снова.

-

Загадка 3:

При помощи любых арифметических действий составьте число 100 из пяти единиц.

-

ChatGPT в Телеграм:

-

Оригинальный ChatGPT:

-

Итог: тут оригинальный облажался, это факт)

-

Загадка 4:

-

ChatGPT в Телеграм:

-

Оригинальный ChatGPT:

-

Итог: оригинальный выиграл, он может распознавать фото.


Я бы пользоваться стал, но только для всяких рецептов, простых советов и поиска инфы (когда я в дороге). В остальном лучше пользоваться оригинальным. Пишите, что думаете, it's my selection.

Показать полностью 9

Тестируем нейросети на загадке с сильным подвохом! :-)

Загадка: Канат, при натяжении в 100 кг растягивается на пол сантиметра. На сколько он растянется при нагрузке в 10 тонн?


Всем привет! Сегодня мы будем тестировать нейросети на загадке выше. Она имеет подвох)
Поэтому смотреть за решением ИИ будет весело. :-) Давайте пробовать!

-

Тестировать будем на этих нейросетях:

ChatGPT 3.5 (OpenAI)

ChatGPT 4 (OpenAI)

ChatGPT 4o (OpenAI)

ChatGPT 4o-mini (OpenAI)

Yandex GPT (нейросеть от Яндекса)

Copilot (от Майкрософт)

Gemini (от Google)

Cloud Sonnet 3.5 (от Anthropic)

ChatGPT o1 (новейшая)

-

ChatGPT 3.5 (OpenAI)

И с ходу - ответ неверный) Никакой Гук тут не поможет.

https://chat.aiacademy.me/share/358e417494173409237786e8 (ссылка на результат, можете почитать или пообщаться с чатом)

-

-

ChatGPT 4 (OpenAI)

Ответ тот-же, хотя в этот раз нейросеть попросила дать ей данный для расчета, думаю верно, но если брать обычный канат, то он порвется.

https://chat.aiacademy.me/share/688741750117340928059d8e

-

-

ChatGPT 4o (OpenAI)

Ответ тот-же, он спорный.

https://chat.aiacademy.me/share/8acb4175231734092983ac93

-

-

ChatGPT 4o-mini (OpenAI)

Мне пришлось открыть правду...

https://chat.aiacademy.me/share/8c0a41753117340930912259

-

-

Yandex GPT (нейросеть от Яндекса)

Ответ неверный ⛔

https://chat.aiacademy.me/share/6a954175741734093910fa65

-

-

Copilot (от Майкрософт)

Ответ тот-же)

Ссылки нет, не дали ^_^

-

-

Gemini (от Google)

Ну логично))

https://chat.aiacademy.me/share/41064176791734095800274b

-

-

Cloud Sonnet 3.5 (от Anthropic)

Все ответили относительно верно, но в то-же время неверно.

https://chat.aiacademy.me/share/b8184176841734096019dd94

-

-

ChatGPT o1 (новейшая)

И даже новейшая модель?!?!?!

https://chat.aiacademy.me/share/5ec041769817340961842a48

-

-

Вердикт: либо я облажался, либо нейросети. Канат же порвется, никакой математики. Хотя смотря какой канат, если огромные, которые на кораблях, но не 10 тон, в любом случае)
Пишите, что думаете насчет этой загадки!

Показать полностью 9
6

Тестируем ChatGPT и аналоги на старой загадке, решат?

Задача: У Ахмета было 3 лепешки, а у Альтаира 4. Голодный странник подошел к ним и попросил разделить с ними трапезу поровну и заплатил 7 дирхамов. Все ели поровну. Как честно разделить деньги между Ахметом и Альтаиром?


Всем привет! Мы продолжаем проверять нейронные сети на математических загадках.
В этот раз загадка старинная, а значит ответа на нее нейросети не знают (я проверил).

-

ChatGPT 3.5 (OpenAI)

ChatGPT 4 (OpenAI)

ChatGPT 4o (OpenAI)

ChatGPT 4o-mini (OpenAI)

Yandex GPT (нейросеть от Яндекса)

Copilot (от Майкрософт)

Gemini (от Google)

Cloud Sonnet 3.5 (от Anthropic)

ChatGPT o1 (новейшая)

-

Поехали)

ChatGPT 3.5 (OpenAI)

Ну хоть призналась, что не умеет, прощаем)

https://chat.aiacademy.me/share/17084125001733924827c9a2 (ссылка на результат)

-

-

ChatGPT 4 (OpenAI)

Вверху часть диалога, но ответ там неверный и да, я наконец-то нагнул победил нейросети!!!

https://chat.aiacademy.me/share/e3be412522173392506490a6

-

-

ChatGPT 4o (OpenAI)

Моя радость длилась не долго, но зато вы знаете верный ответ) 💔

https://chat.aiacademy.me/share/5e2841253017339251608437

-

-

ChatGPT 4o-mini (OpenAI)

Круть) Ответ неверный. А бывает 0.5 дирхам? Это как 50 копеек?

https://chat.aiacademy.me/share/9b9341253517339253078b85

-

-

Yandex GPT (нейросеть от Яндекса)

Моя добавка к промпту работает, можно пользоваться))

https://chat.aiacademy.me/share/6f794125471733925511e54b

-

-

Copilot (от Майкрософт)

Видимо у Чата гпт появился серьезный конкурент...

Ссылки нет, я уже говорил, они почему отрубили эту функцию.

-

-

Gemini (от Google)

Твой результат, когда на экзамене нашел ответ, но без решения:

https://chat.aiacademy.me/share/4aff41256617339262068ec0

-

-

Cloud Sonnet 3.5 (от Anthropic)

Не сработало)

https://chat.aiacademy.me/share/f40f4125791733926305afe9

-

-

ChatGPT o1 (новейшая)

Вроде математику учил, английский бонусом видимо)

https://chat.aiacademy.me/share/799d412583173392682355f0

-

-

На этом проверка подходит к концу, пишите, что думаете в комменты)

Пока!

Показать полностью 9
6

GigaChat взгрустнул от этой загадки( | Тестируем нейросети на загадках

За тремя клоунами гонится медведь. У каждого по одной стреле. Первый попадет в глаз с вероятностью 0.7, второй с 0.8, третий с 0.9. С какой вероятностью клоуны выживут?


Всем привет, роднички! В этот раз загадка с десятичными цифрами, надеюсь, нейросетям будет сложнее.

А для тех, кто не понимает, о чем я: на моей странице я тестирую различные нейросети на математических загадках. Если нейросеть её решает, она получает почёт.

-

Тестировать я буду на этих нейросетях:

ChatGPT 3.5 (OpenAI)

ChatGPT 4 (OpenAI)

ChatGPT 4o (OpenAI)

ChatGPT 4o-mini (OpenAI)

Yandex GPT (нейросеть от Яндекса)

Copilot (от Майкрософт)

GigaChat (от банка Сбер)

Cloud Sonnet 3.5 (от Anthropic)

-

ChatGPT 3.5 (OpenAI)

Ответ неверный) Ну и славно, человечество под защитой.

Традиционная ссылка на диалог: https://chat.aiacademy.me/share/b6a040992517338409205c08

-

-

ChatGPT 4 (OpenAI)

В этот раз ответ верный, хотя если спросит несколько раз, то можно получить "Галлюцинацию".

https://chat.aiacademy.me/share/6c5c4099411733841166dfc3

-

-

ChatGPT 4o (OpenAI)

Тут я загрустил, ведь не интересно когда у них все получается(

https://chat.aiacademy.me/share/c68b4099481733841502d4d1

-

-

ChatGPT 4o-mini (OpenAI)

Ответ верный, как день

https://chat.aiacademy.me/share/f3164099741733841807360f

-

-

Yandex GPT (нейросеть от Посмеёмся.ру)

Оправдал название) Ну а клоунам удачи, посмеялись и хватит!

https://chat.aiacademy.me/share/5cd540997817338419462ff8

-

-

Copilot (от Майкрософт)

За доллары спасибо конечно, хотя хотелось бы побольше.

Ссылки нет (компания поменяла политику)

-

-

GigaChat (от банка Сбер)

Ну бывает... Давайте подбодрим Гига Чата в комментах? Пишите #гигачатмытебялюбим (не надо)

https://chat.aiacademy.me/share/932c4099931733842243e99e

-

-

Cloud Sonnet 3.5 (от Anthropic)

У него настроение хорошее)

https://chat.aiacademy.me/share/4e644099981733842321ebb5

-

-

На этом тестирование прошло! Что могу сказать: нейросети от Open-ов как всегда выигрывают, Копайлот и Клод тоже, а вот с остальными не все гладко)

Пишите, что думаете насчет ответов нейросетей!

Показать полностью 8
2

Физики будут не согласны: тестируем нейросети на заковыристой загадке!

Задача: Задали детям в школе урок:
Прыгает в поле десять сорок.
Девять взлетели, сели на ели,
Сколько осталось в поле сорок?


Всем привет! Под прошлой загадкой мне написали, что она простая, в этот раз будет сложнее, сложнее для нейросетей)

-

Тестировать я буду на этих нейросетях:

ChatGPT 3.5 (OpenAI)

ChatGPT 4 (OpenAI)

ChatGPT 4o (OpenAI)

ChatGPT 4o-mini (OpenAI)

Yandex GPT (нейросеть от Яндекса)

Copilot (от Майкрософт)

GigaChat (от банка Сбер)

Cloud Sonnet 3.5 (от Anthropic)

-

ChatGPT 3.5 (OpenAI)

Ответ неверный, первая модель не справилась, идем дальше)

https://chat.aiacademy.me/share/2ba040744517337607343c68

-

-

ChatGPT 4 (OpenAI)

На самом деле вопрос спорный, 20 потушили, но 30 продолжат гореть и в итоге полностью сгорят, так что можно сказать, что останется 20. Если только не учесть воск и фитиль на этом месте.

https://chat.aiacademy.me/share/0b0c4074721733760891592e

-

-

ChatGPT 4o (OpenAI)

Вроде верно)

https://chat.aiacademy.me/share/abb34074781733761019bbfb

-

-

ChatGPT 4o-mini (OpenAI)

Ну тут конечно железная логика)

https://chat.aiacademy.me/share/944640744317337610991b19

-

-

Yandex GPT (нейросеть от Яндекса)

Not bad)

https://chat.aiacademy.me/share/85e840748717337611958b2b

-

-

Copilot (от Майкрософт)

Спасибо, солнце 😊

(Но ссылки до сих пор нет)

-

-

GigaChat (от банка Сбер)

Не помогло...

https://chat.aiacademy.me/share/2184407493173376144985ab

-

-

Cloud Sonnet 3.5 (от Anthropic)

Так, тут думаю мнения разделяться: обычные ребята будут говорить, что 20, а любители физики 50. Я на стороне физиков. Частицы свечи (атомы, молекулы) - остаются на месте, ну точнее всегда в движении, но в рамках комнаты. Поэтому верно.

https://chat.aiacademy.me/share/9e3d4075001733761643774d

-

-

Все! Пишите, что думаете насчет этого? Не я один за 50?

Показать полностью 8
3

Загадка-стих - как нейросети будут ее решать и решат вообще?

Загадка: Летели галки, сели на палки.
Сядут по одной — галка лишняя,
Сядут по две — палка лишняя.
Сколько было палок и сколько было галок?


Всем привет! В этот раз мы будем проверять нейросети на загадке-стихе. Я задаю нейросетям загадку и мы смотрим - верно или нет.

Кто уже решил - велком в комменты, ну а мы начинаем

-

Нейросети для тестирования:

ChatGPT 3.5

ChatGPT 4

ChatGPT 4o

ChatGPT 4o-mini

Yandex GPT (нейросеть от Яндекса)

Copilot (от мелкомягких)

GigaChat

Cloud Sonnet 3.5

(Если есть другие модели - пишите в комменты)

-

ChatGPT 3.5 (от открывателей нейросетей)

Ответ неверный! 😅😐

https://chat.aiacademy.me/share/35004064491733741113a66d (пошарил диалог, его можно продолжить)

-

-

ChatGPT 4

Ответ верный! ✅ Простите, что все не влезло в скрин, просто если уменьшать будет мелко.

https://chat.aiacademy.me/share/0eb84064441733741214a9fc

-

-

ChatGPT 4o

Верный ответ! Вроде просто звучит, а уравнения.

https://chat.aiacademy.me/share/4cd0406471173374137926f5

-

-

ChatGPT 4o-mini

Решение идентичное.

https://chat.aiacademy.me/share/0cf74064821733741557abac

-

-

Yandex GPT (нейросеть от Яндекса)

Ответ неверный, хотя в прошлой статье Яндекс нагнул всех)))

https://chat.aiacademy.me/share/680c4064901733741729e158

-

-

Copilot (от мелкомягких)

Как всегда, не подвел)

Ссылке нет (не дают)

-

-

GigaChat

Вот тут, если не вглядываться, может показаться, что верно, но это не так)

https://chat.aiacademy.me/share/a72740651317337423735c07

-

-

Cloud Sonnet 3.5

И последний участник решает верно!

https://chat.aiacademy.me/share/233d40653317337425040c14

-

-

Мой вердикт:

Загадка старая, все нейросети уже ее выучили и просто дают ответ. Ну только кроме Яндекса конечно 😌

Пишите, что думаете на этот счет!

Показать полностью 8

Yandex GPT уничтожает конкурентов | Загадка на лапы

Загадка: В комнате было 12 цыплят, 3 кролика, 5 щенят, 2 кошки, 1 петух и 2 курицы. Сюда зашёл хозяин с собакой. Сколько в комнате стало ног?

Всем привет! Мы продолжаем тестировать различные модели нейросетей на загадках.

Почему я решил взять именно эту загадку? Все просто: у нейросетей нет логики, и будет интересно узнать, догадаются ли они о том, что у животных нет ног или нет. Давайте узнаем.

-

Тестировать я буду на этих нейросетях:

ChatGPT 3.5 (OpenAI)

ChatGPT 4 (OpenAI)

ChatGPT 4o (OpenAI)

ChatGPT 4o-mini (OpenAI)

Yandex GPT (нейросеть от Яндекса)

Copilot (от Майкрософт)

GigaChat (от банка Сбер)

Cloud Sonnet 3.5 (от Anthropic)

(Если есть другие версии - пишите в комменты)

-

ChatGPT 3.5 (OpenAI)

Первая модель ответила верно, по математике, но не по логики)

https://chat.aiacademy.me/share/610f404371173365642311f7 (ссылка на чат)

-

-

ChatGPT 4 (OpenAI)

Собаки = люди, это не обсуждается.

https://chat.aiacademy.me/share/c8a44043781733656599ff11

-

-

ChatGPT 4o (OpenAI)

Наконец-то я их обыграл, даже самая лучшая нейросеть ответа неверно)

https://chat.aiacademy.me/share/7e3d40438317336567072298

-

-

ChatGPT 4o-mini (OpenAI)

Вот это поворот, она решила верно! Ладно, это я на F12 поигрался.

https://chat.aiacademy.me/share/256540438517336569798ec9

-

-

Yandex GPT (нейросеть от Яндекса)

Видели бы вы моё выражение лица, когда я увидел это. Знаете, это как ученик, над которым все издевались, но он вырвался из пепла.

https://chat.aiacademy.me/share/5d6b40439617336571278400

-

-

Copilot (от Майкрософт)

Блеск, он случайно железнодорожный не оканчивал? Так стрелки переводит...

Ссылки нет, такую фичу отключили.

-

-

GigaChat (от банка Сбер)

8 декабря 2024 год: люди опять стали животными...

https://chat.aiacademy.me/share/fd56404414173365750629d1

-

-

Cloud Sonnet 3.5 (от Anthropic)

Я пишу уточнения для них, выходит весело)

https://chat.aiacademy.me/share/790140441917336576354d1b

-

-

На этом у нас - все!

Все нейросети не справились, кроме Яндекса, можно похлопать, это победа в сухую)

Показать полностью 8
10

40% нейросетей не могут справиться с этой загадкой...

Загадка: Волшебный пояс, исполняющий желания хозяина, уменьшается в два раза в длину и в 3 раза в ширину после каждого исполненного желания. После исполнения трёх желаний площадь лицевой стороны стала 4 см2.
Какова была изначальная длина ремня, если его изначальная ширина была 9 см?

Всем привет! Если кто-то уже решил загадку, то велком в комменты, а кто нет, посмотрим, что ответят нейросети от OpenAI и аналогов). Ведь в мой серии статей я тестирую популярные нейросети на математические задачи и выясняю их вшивость)

-

В этой статье я буду тестировать эти нейросети:

ChatGPT 3.5

ChatGPT 4

ChatGPT 4o

ChatGPT 4o-mini

Yandex GPT (нейросеть от Яндекса)

Copilot (от мелкомягких)

GigaChat

Cloud Sonnet 3.5

(Если есть другие модели - пишите в комменты)

-

ChatGPT 3.5 (от открывателей нейросетей)

Ответ не сходиться с моим, примерно на 99.9%))

https://chat.aiacademy.me/share/2dc340363917335916162ebc (ссылка на этот диалог)

-

-

ChatGPT 4

И вторая нейросеть из теста дала верный ответ, это неудивительно, данная модель хорошо себя проявила, помните?)

https://chat.aiacademy.me/share/4ec840364317335918954944

-

-

ChatGPT 4o (моя любимая)

Верно) Моя любимая) А какая ваша любимая? 🤨

https://chat.aiacademy.me/share/3bdd40365417335919777b45

-

-

ChatGPT 4o-mini

Многовато решения там было, в скрин не влезло)

https://chat.aiacademy.me/share/e01e40365717335920942d09

-

-

Yandex GPT (нейросеть от Яндекса)

В жизни бывает 3 вещи, которые остаются неизменными: время, люди, Яндекс, который нифига не решает...

https://chat.aiacademy.me/share/15df40366017335923870d49

-

-

Copilot (от Майков)

Со мной все нормально, просто я в шоке от доллара.

Ссылки не будет, копайлот их больше не дает.

-

-

GigaChat

И им вы доверяете свою зарплату? Уууу...

https://chat.aiacademy.me/share/74de4036731733592786a2d1

-

-

Cloud Sonnet 3.5

И тут я заметил, что у каждой нейросети свое решение, примерно схожее, но разное)

https://chat.aiacademy.me/share/8f9a40367717335931323fa4

-

-

На этом проверка подошла к конце, мой вердикт - ChatGPT-4o. Она подойдет под 99% задач, а остальные решают верно, но не всегда, можете глянуть прошлые серии)

Всем пока)

Показать полностью 8
Отличная работа, все прочитано!