Про термин общий ИИ
Что такое Общий Искусственный Интеллект (AGI) на самом деле и почему его определение постоянно меняется?
Это обсуждение на тему затронутую в интервью с Сергеем Марковым об определениях Общего ИИ (интервью целиком можно посмотреть здесь)
В этом выпуске мы разбираемся в одном из самых скользких терминов в мире технологий. Узнайте, как изначально AGI задумывался в 1997 году, почему современные языковые модели сделали это определение неактуальным, и какие новые, более практичные критерии оценки вводят исследователи. Мы рассмотрим, почему коммерческие определения вроде "заработать 500 миллиардов долларов" не помогают науке, и почему тесты вроде ARC-AGI-3 становятся новым стандартом для измерения истинного общего интеллекта, а не просто имитации.
Происхождение и изначальное определение Общий Искусственный Интеллект (AGI)
Термин Общий Искусственный Интеллект (AGI) был впервые предложен Марком Губрудом в статье 1997 года. Он был введен для обозначения противоположного полюса по отношению к существующему тогда узкому (слабому) ИИ. Изначально AGI определялся как гипотетическая система, способная решать неопределенно широкий круг интеллектуальных задач на уровне человеческого разума.
Однако по мере развития технологий (особенно с появлением больших языковых моделей) это определение стало недостаточно точным. Возникли вопросы: на каком уровне человеческих способностей ориентироваться (эксперт или неэксперт)? Что значит "успешно решить задачу" (особенно генеративную)? И в каких ресурсах (например, временных) должна быть решена задача? Попытка формализовать эти критерии для оценки AGI на практике вызывает сложности. Пример с шахматами о временных ресурсах - еще в 1940е годы можно было написать программу, которая точно найдет лучший ход и обыграет любого гроссмейстера, но это займет миллион лет. Без учета требований к ресурсам - эта программа подходила бы под критерий сильного ИИ того времени, когда компьютер еще не мог обыграть человека в шахматы.
В результате, из-за нечеткости исходного определения, разные команды начали предлагать свои трактовки. В качестве примера приводится циничное определение из переписки OpenAI и Microsoft, где AGI якобы определяется как система, способная заработать 500 миллиардов долларов. Автор считает такие коммерческие определения непродуктивными для исследований, поскольку они служат маркетинговым целям. В ответ на это, исследовательские группы предпочитают вводить собственные, более четкие концепции (например, "практичный AGI") с измеримыми бенчмарками.
Дальше мы поговорим с моделью Qwen 3 Max и попросим ее ответить на вопросы, которые возникли во время чтения интервью.
Ответы на вопросы из обсуждения
Какое сегодня определение Общего ИИ можно считать главным или какие наиболее интересные определения?
Точное определение AGI до сих пор не сложилось, но большинство экспертов определяет его как ИИ, который соответствует или превосходит человеческие способности. Существует несколько подходов к определению: Академическое определение: AGI — это тип искусственного интеллекта, способный к самообучению, адаптации к ранее неизвестным ситуациям и решению широкого спектра задач. Практическое определение: С практической точки зрения, AGI означает ИИ, который может выполнять большинство экономически ценных задач. Коммерческое определение: Как упоминалось в обсуждении, есть и более циничные определения, например, от OpenAI и Microsoft, где AGI определяется через способность заработать 500 миллиардов долларов. Бенчмарк-ориентированное определение: Некоторые исследователи предлагают определять AGI через прохождение конкретных тестов, таких как ARC-AGI, которые измеряют способность к адаптации в новых условиях.
Что такое "практичный AGI"?
"Практичный AGI" (Practical AGI) — это концепция, которая фокусируется на реальных возможностях систем, а не на идеальном человеческом уровне интеллекта. Практичные AGI-системы обладают общей, но ограниченной и в некоторой степени неопределенной знанием о мире. С практической точки зрения, AGI означает ИИ, способный выполнять большинство экономически ценных задач, что позволяет отойти от мистификации и сосредоточиться на измеримых результатах. Для оценки такого ИИ разрабатываются специальные бенчмарки, основанные на практических, реалистичных и высоко-влиятельных задачах.
Какое место занимают тесты вида ARC-AGI-3 для измерения достижимости общего ИИ?
ARC-AGI-3 занимает важное место в оценке прогресса к AGI как первый интерактивный бенчмарк, специально разработанный для измерения способности ИИ к обобщению в совершенно новых, невиданных средах. Этот бенчмарк считается "единственным стандартом, специально разработанным для измерения адаптивности к новизне" в системах ИИ. ARC-AGI-3 оценивает общий интеллект через абстрактное рассуждение и способность к обучению в незнакомых ситуациях без предварительных знаний. Он измеряет "эффективность приобретения навыков в новых условиях", что считается ключевой характеристикой общего интеллекта. Многие исследователи рассматривают ARC-AGI как "окончательный стандарт для оценки возможностей LLM в области общего интеллекта".
Не являются ли они разновидностью примитивных тестов, которые из-за простоты может пройти любой человек, но не может пройти LLM из-за другого восприятия времени?
Действительно, ARC-AGI выявляет фундаментальные ограничения современных LLM в области общей интеллектуальной способности. Несмотря на то, что эти задачи кажутся простыми для человека, LLM показывают низкие результаты на этом бенчмарке. Однако проблема не столько в "восприятии времени", сколько в архитектурных ограничениях текущих моделей. ARC-AGI требует не только восприятия и интуиции, но и способности к абстрактному рассуждению, что выходит за рамки стандартных возможностей LLM. Важно отметить, что создатель бенчмарка Франсуа Шолле подчеркивает: прохождение теста не равнозначно достижению AGI. Сам бенчмарк был разработан именно для проверки того, могут ли ИИ-системы учиться самостоятельно в совершенно незнакомых ситуациях, без каких-либо предварительных знаний. Таким образом, низкие результаты LLM на ARC-AGI отражают не примитивность теста, а ограниченность текущих архитектур в задачах, требующих истинного обобщения и адаптации.
Обсуждение создано автоматически с помощью разных нейросетей
Лига Новых Технологий
1.9K поста16.9K подписчиков
Правила сообщества
Главное правило, это вести себя как цивилизованный человек!
Но теперь есть еще дополнительные правила!
1. Нельзя раскручивать свой сайт, любую другую соц сеть или мессенджер, указывая их как источник. Если данная разработка принадлежит вам, тогда можно.
2. Нельзя изменять заглавие или текст поста, как указано в источнике, таким образом чтобы разжигать конфликт.
3. Постите, пожалуйста, полный текст с источника, а не превью и ссылка.