Просто идея как до обучать модели LLM на интернете

Принцип до обучения LLM:

1. Начальная конфигурация:

- Учитель: Продвинутая LLM модель

- Ученик: Базовая LLM модель

- База знаний: Интернет-ресурсы

2. Процесс обучения:

a) Учитель выбирает вопрос из списка вопросов c ответами

b) Ученик пытается ответить

c) Учитель проверяет ответ

3. Логика обработки ответа:

ЕСЛИ ответ верный:

- Переход к следующему вопросу

- Сохранение успешного паттерна

ИНАЧЕ:

- Ученик исследует интернет-источники

- Собирает релевантную информацию

- Формулирует новый ответ

- Цикл повторяется до правильного ответа

4. Механизм дообучения:

- При правильном ответе:

Интеграция новых знаний (я про тексты сайтов) в модель

Обновление весов нейронной сети

Идея основана на технологии Deep research, которая используя интернет набирает высокие (пока на сегодняшнем уровне развития ИИ) оценки на "Humanity's Last Exam" - "Последний экзамен человечества". Ведь он помогает модели найти пробелы в знаниях и заполнить их информацией из интернета.

Может это уже используют, но пока не слышал. Я же всё таких человек и не могу всё знать.

Больше постов читайте по тегу «Обучение». А если сами хотите изучить новую профессию, посмотрите актуальные курсы от проверенных школ с реальными отзывами на сайте Пикабу Курсы.