Сегодня я всю ночь я тестировал и внедрял эту нашумевшую O1 Preview от OpenAI в бота.
Она умопомрачительно хороша. Легко решает задачи по матану и общефизу 1-2 курса технических вузов. Школьные задачи в основном тоже.
Чему равен икс в уравнении x^x = 2^2048? А корни кубического уравнения? А сколько зеленоглазых мудрецов сбежали с острова?
На эти вопросы буквально за минуту отвечает O1-preview.
1/3 - ChatGPT неточный. Заставь его рассуждать и почти "мыслить".
В общем, на днях я сделал бота решателя домашек и долго думал, как все же заставить его решать задачки на университетском уровне.
Хотелось, чтобы он решал задачи с условного 1 курса матана и физики.
После нескольких ночей тестов понял, что очень решают твои последовательности промптов и то, как ты заставляешь сетки думать, создавать цепочки рассуждений, оценивать их и выбирать правильное решение.
Как я понял, вот этот "процесс мышления" который я пытался автоматизировать и есть примерно тот самый Reasoning от новой сети OpenAI. Только у них это сделано профессионалами.
Ну и конечно же, как только она вышла, я прикрутил её к боту.
2/3 - Вообще, существующие нейросетки уже хорошо справляются со школьными задачами
На школьном уровне, особенно до 9 класса хорошо работают почти все флагманские сети gpt4o, gemini pro 1.5 и claude sonnet 3.5.
Хорошая серия нужных промптов решает многие задачи по научным предметам. И рвет гуманитарные предметы.
На lmarena.ai можно посмотреть текущий Эло рейтинг сеток и узнать что круче всего подходит для ваших задач.
3/3 - С какими задачами круто справляется новая сетка O1 Overview
Вычисляет не самые простые производные:
Пример решения в Карусели: очень разумные последовательные шаги. Поразительно, что это все делает нейросеть.
Просто класс. Еще и ответ совпадает с правильным.
Кстати, круто что в боте решения получаются также в красивой Latex разметке в webapp - пришлось постараться, чтобы ничего не съезжало.
1) O1 берет несложные интегралы
2) Вычисляет пределы, решает диффуры
3) Может ответить на несложные головоломки
Потестировать можно в тг @super_botan_bot