Просто идея как до обучать модели LLM на интернете⁠⁠

Принцип до обучения LLM:
1. Начальная конфигурация:
- Учитель: Продвинутая LLM модель
- Ученик: Базовая LLM модель
- База знаний: Интернет-ресурсы
2. Процесс обучения:
a) Учитель выбирает вопрос из списка вопросов c ответами
b) Ученик пытается ответить
c) Учитель проверяет ответ
3. Логика обработки ответа:
ЕСЛИ ответ верный:
- Переход к следующему вопросу
- Сохранение успешного паттерна
ИНАЧЕ:
- Ученик исследует интернет-источники
- Собирает релевантную информацию
- Формулирует новый ответ
- Цикл повторяется до правильного ответа
4. Механизм дообучения:
- При правильном ответе:
Интеграция новых знаний (я про тексты сайтов) в модель
Обновление весов нейронной сети

Идея основана на технологии Deep research, которая используя интернет набирает высокие (пока на сегодняшнем уровне развития ИИ) оценки на "Humanity's Last Exam" - "Последний экзамен человечества". Ведь он помогает модели найти пробелы в знаниях и заполнить их информацией из интернета.

Может это уже используют, но пока не слышал. Я же всё таких человек и не могу всё знать.

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества