Просто идея как до обучать модели LLM на интернете
Принцип до обучения LLM:
1. Начальная конфигурация:
- Учитель: Продвинутая LLM модель
- Ученик: Базовая LLM модель
- База знаний: Интернет-ресурсы
2. Процесс обучения:
a) Учитель выбирает вопрос из списка вопросов c ответами
b) Ученик пытается ответить
c) Учитель проверяет ответ
3. Логика обработки ответа:
ЕСЛИ ответ верный:
- Переход к следующему вопросу
- Сохранение успешного паттерна
ИНАЧЕ:
- Ученик исследует интернет-источники
- Собирает релевантную информацию
- Формулирует новый ответ
- Цикл повторяется до правильного ответа
4. Механизм дообучения:
- При правильном ответе:
Интеграция новых знаний (я про тексты сайтов) в модель
Обновление весов нейронной сети
Идея основана на технологии Deep research, которая используя интернет набирает высокие (пока на сегодняшнем уровне развития ИИ) оценки на "Humanity's Last Exam" - "Последний экзамен человечества". Ведь он помогает модели найти пробелы в знаниях и заполнить их информацией из интернета.
Может это уже используют, но пока не слышал. Я же всё таких человек и не могу всё знать.