Сравниваем нейросетки на Python-задачах. Раунд 3⁠⁠

Сегодня проверяем нейросетки на алгоритмической задаче:

Есть лестница с определенным известным количеством ступенек. Мы поднимаемся по лестнице и на каждом шаге можем наступать на следующую ступеньку или шагнуть через одну, пройдя сразу 2 ступеньки за шаг. Нужно найти число способов, которыми можно подняться по лестнице с указанным количеством ступенек.

🤖Результаты получились неплохие – 7 моделей справились с задачей. Интересно, что способы решения при этом отличались: GPT3.5, GPT4, Bing, Sage, Claude Instant использовали динамическое программирование, а Bard и Claude+ использовали рекурсию.

🔀 На самом деле оба способа имеют право на существование, поэтому не совсем понятно, какому из них отдать предпочтение. С одной стороны, рекурсия лаконичнее, но всё же такой способ имеет экспоненциальную временную сложность O(2^n), так как одни и те же значения вычисляются многократно, а вот динамический подход имеет временную сложность имеет сложность O(n).

Поэтому дадим GPT3.5, GPT4, Bing, Sage, Claude Instant по 2 балла, а Bard и Claude+ – по одному.

📊 Промежуточные результаты после 3 раундов:
🥇 Bard, Bing, GPT4 – 4;
🥈 GPT3.5, Sage – 3;
🥉 Claude Instant – 2;
😗 Claude+, Koala – 1;
💩 Остальные по нулям.

Пока не удается вытащить из каких-то опенсорсных моделей хоть какой-то интересный результат. Возможно, итоги будут очевидными 🙄

А варианты всех моделей, как обычно, доступны в колабе.

Предыдущие сравнения: Раунд 1 , раунд 2.