Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Рыбачь в мире, пережившем апокалипсис. Люби мутантов, ищи артефакты, участвуй в рейдах и соревнованиях. Изготавливай снаряжение, развивай навыки, поддерживай союзников и раскрывай загадки этого мира.

Аномальная рыбалка

Симуляторы, Мидкорные, Ролевые

Играть

Топ прошлой недели

  • Animalrescueed Animalrescueed 43 поста
  • XCVmind XCVmind 7 постов
  • tablepedia tablepedia 43 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
3
user11222293
Лига Новых Технологий

Что, если ИИ сам взломает процесс исследований?⁠⁠

21 день назад

Автор: Денис Аветисян


Tongyi DeepResearch демонстрирует превосходную производительность в бенчмарках, подтверждая свою эффективность и надежность в различных задачах.

Tongyi DeepResearch демонстрирует превосходную производительность в бенчмарках, подтверждая свою эффективность и надежность в различных задачах.

В эпоху стремительного развития искусственного интеллекта, когда традиционные языковые модели сталкиваются с ограничениями в решении сложных задач рассуждения и требующих значительных вычислительных ресурсов, возникает ключевой конфликт между потребностью в масштабируемости и необходимостью глубокого понимания контекста. В ‘Tongyi DeepResearch Technical Report’, авторы осмеливаются исследовать границы возможного, представляя новую парадигму – агентные системы глубоких исследований. Однако, несмотря на обещающие результаты, возникает вопрос: способна ли эта новая архитектура, объединяющая агентное обучение и масштабируемый поиск информации, преодолеть фундаментальные ограничения существующих моделей и по-настоящему раскрыть потенциал искусственного интеллекта для автономного проведения научных исследований?

Преодолевая Разрыв в Рассуждениях: Tongyi DeepResearch – Инструмент Логической Чистоты

Традиционные языковые модели, несмотря на впечатляющие успехи в генерации текста, демонстрируют ограниченные возможности при решении задач, требующих сложного логического вывода. Каждая операция, каждое логическое заключение требует экспоненциального роста вычислительных ресурсов, что делает масштабирование этих моделей проблематичным. Недостаточность заключается не в объеме данных, а в архитектуре, неспособной эффективно представлять и обрабатывать сложные взаимосвязи между понятиями.

В ответ на эту проблему, исследователи представили Tongyi DeepResearch – агент, основанный на принципах агентного искусственного интеллекта. В отличие от пассивных языковых моделей, Tongyi DeepResearch активно взаимодействует с окружающей средой, планирует свои действия и адаптируется к изменяющимся условиям. Это позволяет ему решать задачи, которые недоступны традиционным моделям, благодаря способности разбивать сложные проблемы на более мелкие, управляемые этапы.

Ключевым новшеством Tongyi DeepResearch является объединение этапов агентного обучения – предварительного и последующего. Данный подход позволяет не только эффективно использовать доступные данные, но и формировать у модели устойчивую основу для дальнейшего развития. Предварительное обучение направлено на формирование базовых навыков планирования и взаимодействия, в то время как последующее обучение – на совершенствование этих навыков и адаптацию к конкретным задачам. Это позволяет избежать перегрузки модели избыточной информацией и сосредоточиться на формировании ключевых компетенций.

Обучающий процесс Tongyi DeepResearch включает в себя последовательность этапов, направленных на создание эффективной модели.

Обучающий процесс Tongyi DeepResearch включает в себя последовательность этапов, направленных на создание эффективной модели.

В качестве основы для Tongyi DeepResearch была выбрана модель Qwen3-30B-A3B-Base. Данный выбор обусловлен ее архитектурными особенностями и потенциалом для дальнейшего развития. Модель обеспечивает необходимую вычислительную мощность и гибкость для реализации сложных алгоритмов планирования и вывода. При этом, благодаря использованию современных методов оптимизации, удалось сохранить разумный баланс между производительностью и вычислительными затратами. Исследователи подчеркивают, что выбор базовой модели – не случайность, а результат тщательного анализа и сравнения различных архитектур.

Таким образом, Tongyi DeepResearch представляет собой значительный шаг вперед в области агентного искусственного интеллекта. Его архитектура и алгоритмы позволяют эффективно решать сложные задачи, требующие планирования, вывода и адаптации к изменяющимся условиям. Данная работа открывает новые возможности для автоматизации интеллектуальных задач и создания более эффективных систем искусственного интеллекта.

Культивирование Агентного Интеллекта: Двухступенчатый Подход к Обучению

Исследования в области искусственного интеллекта неуклонно продвигаются к созданию систем, способных к автономному решению сложных задач. В данной работе исследователи представляют Tongyi DeepResearch – систему, основанную на принципах агентного обучения, и предлагают двухэтапный подход к ее тренировке, обеспечивающий как фундаментальную предрасположенность к рациональному поведению, так и возможность масштабирования для решения реальных задач.

Первый этап, названный исследователями Agentic Mid-Training, направлен на формирование у модели присущих ей агентных предубеждений. Это достигается путем предварительного обучения на масштабных наборах высококачественных данных, демонстрирующих образцы рационального поведения. Цель состоит не просто в обучении модели имитировать определенные действия, но и в привитии ей фундаментального понимания принципов планирования, поиска информации и принятия решений. Вместо слепого следования инструкциям, модель приобретает внутреннюю мотивацию к достижению целей.

Синтез масштабных данных о поведении агентов позволяет провести предварительное обучение Tongyi DeepResearch, улучшая его адаптивность и производительность.

Синтез масштабных данных о поведении агентов позволяет провести предварительное обучение Tongyi DeepResearch, улучшая его адаптивность и производительность.

Второй этап, Agentic Post-Training, служит для дальнейшей шлифовки этих способностей посредством масштабируемого многоходового обучения с подкреплением. Этот этап позволяет модели не только изучать новые стратегии, но и адаптироваться к меняющимся условиям, оптимизируя свое поведение в ответ на обратную связь от окружающей среды. Ключевым моментом здесь является возможность обучения в интерактивном режиме, где модель получает вознаграждение за успешные действия и штрафы за ошибки.

Следует подчеркнуть, что синтетические данные играют решающую роль в обоих этапах обучения. Исследователи справедливо отмечают, что реальные данные часто бывают недостаточными для эффективного обучения сложных моделей. Синтетические данные позволяют восполнить этот пробел, предоставляя модели возможность изучать широкий спектр сценариев и ситуаций, которые трудно или невозможно воспроизвести в реальном мире. Это особенно важно для обучения моделей, способных к автономному решению задач, где необходима способность к планированию и принятию решений в условиях неопределенности.

Таким образом, предложенный двухэтапный подход к обучению Tongyi DeepResearch представляет собой элегантное и эффективное решение для создания автономных интеллектуальных агентов. Акцент на формировании фундаментальных способностей к рациональному поведению в сочетании с масштабируемым обучением с подкреплением позволяет создать систему, способную не только решать сложные задачи, но и адаптироваться к меняющимся условиям и учиться на своих ошибках. Логика и математическая строгость, лежащие в основе данного подхода, являются ключевыми факторами, обеспечивающими надежность и предсказуемость поведения системы.

Оркестровка Мысли: Контекст и Механизмы Рассуждений

В основе Tongyi DeepResearch лежит тщательно продуманная архитектура, направленная на достижение не просто работоспособности, но и принципиальной корректности в процессе решения задач. Исследователи отказались от эвристических подходов, предпочитая им строгую логику и доказуемость алгоритмов. Ключевым элементом этой архитектуры является механизм управления контекстом – метод динамической реконструкции рабочего пространства, формирующего основу для процесса рассуждений. Этот подход позволяет агенту эффективно ориентироваться в сложных задачах, избегая накопления избыточной информации и сохраняя фокус на существенных деталях.

Взаимодействие с внешним миром и генерация ответов осуществляется посредством интеграции ReAct Framework. Этот подход синергично объединяет рассуждения и действия в чередующейся последовательности, обеспечивая эффективное решение проблем. В отличие от моделей, полагающихся на статические шаблоны, Tongyi DeepResearch способен адаптироваться к изменяющимся условиям, генерируя ответы, основанные на актуальной информации и логических выводах.

Оптимизация процесса обучения осуществляется посредством применения GRPO Algorithm – метода обучения с подкреплением, направляющего агента к улучшению производительности. В отличие от методов, основанных на случайном исследовании пространства решений, GRPO Algorithm использует целевую функцию, максимизирующую вероятность получения корректного ответа. Этот подход обеспечивает стабильность и предсказуемость процесса обучения, гарантируя, что агент приобретает навыки, необходимые для решения поставленных задач.

В режиме Heavy Mode Tongyi DeepResearch демонстрирует превосходство над современными моделями в задачах, требующих высокой точности и вычислительных ресурсов.

В режиме Heavy Mode Tongyi DeepResearch демонстрирует превосходство над современными моделями в задачах, требующих высокой точности и вычислительных ресурсов.

Сочетание управления контекстом, ReAct Framework и GRPO Algorithm позволяет Tongyi DeepResearch эффективно решать сложные задачи и генерировать содержательные ответы. Исследователи подчеркивают, что данный подход ориентирован не на достижение максимальной производительности на тестовых примерах, а на обеспечение принципиальной корректности и логической обоснованности принимаемых решений. Такой подход обеспечивает не только высокую точность, но и возможность интерпретации и анализа процесса решения, что является важным фактором для доверия и контроля над системой.

В отличие от систем, полагающихся на статистические закономерности, Tongyi DeepResearch стремится к пониманию сути проблемы и генерации ответов, основанных на логических выводах и доказательствах. Этот подход обеспечивает не только высокую точность, но и возможность адаптации к новым задачам и условиям, что делает Tongyi DeepResearch перспективным инструментом для решения широкого круга проблем.

Продемонстрированная Производительность: Сравнение с Передовыми Методами

Исследования, проведенные авторами, охватывают широкий спектр эталонных тестов, что позволяет оценить не просто работоспособность системы Tongyi DeepResearch, но и её способность к последовательному, логически обоснованному рассуждению. Особое внимание уделено проверке системы в задачах, требующих глубокого анализа и синтеза информации.

Проверка на эталонных тестах, таких как WebWalkerQA, Humanity's Last Exam и GAIA, демонстрирует развитые способности системы к рассуждению. Авторы подтверждают, что система не просто предоставляет ответы, но и выстраивает логическую цепочку, позволяющую прийти к этим ответам. Это особенно важно в задачах, где требуется не просто знание фактов, но и умение их интерпретировать.

Результаты, полученные на тестах BrowseComp, xbench-DeepSearch, FRAMES и xbench-DeepSearch-2510, подтверждают эффективность Tongyi DeepResearch в задачах глубокого поиска и анализа информации в сети Интернет. Система демонстрирует способность не просто находить релевантные данные, но и эффективно обрабатывать их, извлекая из них полезную информацию. Это особенно важно в эпоху информационного изобилия, когда поиск нужной информации может быть затруднен.

Результаты тестов на общих бенчмарках подтверждают высокую производительность и обобщающую способность Tongyi DeepResearch.

Результаты тестов на общих бенчмарках подтверждают высокую производительность и обобщающую способность Tongyi DeepResearch.

Полученные результаты демонстрируют, что Tongyi DeepResearch достигает сопоставимой или превосходящей производительности по сравнению с существующими методами. Авторы подчеркивают, что такая эффективность не является случайностью, а является следствием тщательно разработанной архитектуры и алгоритмов, которые обеспечивают не только высокую скорость, но и точность и надежность. Данные достижения подтверждают потенциал Tongyi DeepResearch для ускорения исследований и открытия новых знаний. Авторы стремятся не просто создать работающую систему, но и предоставить инструмент, который позволит ученым и исследователям решать сложные задачи и открывать новые горизонты.

В заключение, стоит отметить, что представленные результаты являются убедительным доказательством эффективности Tongyi DeepResearch. Авторы предоставили не просто набор цифр, но и тщательно проанализированные данные, которые подтверждают, что система действительно способна решать сложные задачи и открывать новые возможности. Их подход, основанный на принципах математической чистоты и логической обоснованности, является примером того, как должна строиться современная научная работа.

Без точного определения задачи любое решение — шум. Исследователи в данной работе демонстрируют эту истину, создавая Tongyi DeepResearch – агента, который требует четкого понимания целей обучения и синтеза данных. Как писал Блез Паскаль: “Всякое знание начинается с осознания собственного незнания.” (“Все познание начинается с осознания собственного незнания.”). Этот принцип напрямую применим к созданию эффективных агентов. Автоматизированный синтез данных, ключевой аспект Tongyi DeepResearch, требует от агента не просто генерации данных, но и оценки их соответствия поставленной задаче. Иначе, любой синтезированный набор данных – лишь шум, не способствующий прогрессу в обучении с подкреплением и, следовательно, снижающий эффективность агента. Авторы подчеркивают важность контекстного управления, что является прямым следствием необходимости четкого определения целей и границ решаемой задачи.

Что дальше?

Исследование, представленное авторами, безусловно, представляет собой шаг вперед в создании агентов, способных к самостоятельному исследованию. Однако, утверждение о “государственном уровне” результатов требует тщательной проверки. Успех, демонстрируемый в рамках предложенной архитектуры Tongyi DeepResearch, тесно связан с качеством используемых больших языковых моделей (LLM). Любая ошибка в LLM, даже незначительная, неизбежно приведет к каскаду неточностей в процессе автоматического синтеза данных и обучения с подкреплением. Это фундаментальное ограничение, которое необходимо учитывать.

Более того, сложность алгоритма управления контекстом и выбора стратегий обучения, вероятно, имеет асимптотическую сложность, препятствующую масштабированию. Простое увеличение объема синтетических данных не гарантирует улучшение результатов, а может привести к переобучению агента на искусственно созданных примерах. Необходимо разработать формальные методы верификации корректности и оптимальности этих стратегий, а не полагаться на эмпирические наблюдения.

В конечном счете, истинный прогресс в области агентов для научных исследований заключается не в создании все более сложных систем, а в разработке математически строгих алгоритмов, гарантирующих корректность и эффективность. Пока же, предложенная архитектура остается интересным, но все еще не доказанным, шагом в этом направлении. Будущие исследования должны сосредоточиться на формальной верификации и разработке алгоритмов с гарантированными свойствами сходимости и оптимальности.


Оригинал статьи: denisavetisyan.com

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 4
[моё] Исследования Статья Наука Будущее Эволюция Длиннопост
2
4
PontiffSulyvahn
PontiffSulyvahn
Наука и технологии
Серия Наука и технологии

Стал доступен для предзаказа домашний робот Neo⁠⁠

21 день назад

Свершилось: первый из анонсированных несколько лет назад домашних роботов стал доступен для предзаказа. Глядите, какой симпатяжка:

И стоит не слишком дорого, всего 20 тысяч долларов, жена обойдётся заметно дороже. А если кому нужен тестовый период, то за 500 долларов компания-производитель предоставит робота в рабство на месяц.

Управлять роботом можно при помощи голоса или через мобильное приложение, причём через интернет или даже VR.

Первые поставки начнутся в 2026 году белым господам в США. Роботы производятся в Калифорнии, производственные мощности ограничены, так что пусть весь остальной мир подождёт.

Что может робот? Ну, на промо-роликах и в промо-материалах производитель показывает много: и ящики Neo таскает, и полы пылесосит, и окна протирает и даже поговорить с ним можно:

Пафосный ролик, в котором счастливые кожаные предаются безделью, а угнетаемые железные на них пашут:

А что в реальности? В реальности всё куда как менее приятно, фактически, речь идёт о программе раннего доступа для энтузиастов.

Neo Home Robot действительно предназначен для выполнения домашних дел а автономном режиме, однако функциональность его ограничена. Там, где робот не сможет справиться самостоятельно, подключается (через 5G или Wi-Fi) удалённый оператор. Производитель говорит, что только по желанию самого пользователя, но кто знает, как там на самом деле и как поведёт себя оператор. Кроме того, остро встаёт проблема безопасности: любой канал связи можно взломать при желании. Вот он, новый сюжет для триллеров.

Ну и ТТХ:

  • Рост: 170 см.

  • Вес: 30 кг.

  • Максимальная скорость ходьбы: 6,2 м/с (убежать будет сложно);

  • Ёмкость аккумулятора: 842 Втч, 4 часа работы;

  • Скорость заряда: примерно 210 Втч за 6 минут;

  • Водонепроницаемые руки;

  • Возможность работать внутри дома и снаружи;

  • Мягкая оболочка (душить будет нежно);

  • Уровень шума: 22 дБ.

Пока это, конечно, дорогая игрушка, но через несколько лет действительно станет помощником по хозяйству.

P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):

О науке, творчестве и прочей дичи: https://t.me/deeplabscience;

Вот тут про молекулярную биологию, медицину и новые исследования: https://t.me/nextmedi.

Показать полностью 2 1
[моё] Будущее Робот Робототехника Автоматизация Киберпанк Видео YouTube Длиннопост
5
6
logrinium
logrinium
Авторские истории
Серия Лидирующие мнения

Лидирующие мнения - Колония - периодическая катастрофа⁠⁠

21 день назад

Привет гуманоидам!
Значит, смотрите: мне в голову пришла идея об интерактивном участии читателя в жизни персонажей и истории в целом. Сомневаюсь, что в этом я новатор, но попробовать охота.
В общем, схема такая:

* вам, гуманоиды, предлагается сюжетная глава (в данном случае - это колония на отдаленной планете, с условиями, максимально приближенными к земным);
* в определённый момент, перед персонажами (и читателями) встаёт некая дилемма, которую персонажи произведения обязаны решить. В качестве интерактивного механизма предлагается опрос в конце главы, в котором размещаются варианты разрешения дилеммы или "свой вариант" в комментарии;
* читатели выбирают вариант, к которому должно прибегнуть руководство колонии (или иные персонажи истории), после чего, в следующем посте, сюжет развивается как последствия выбранного решения. То есть, если читатели выберут неразумный вариант, объективно ведущий к исчезновению колонии или очень серьезным проблемам - сюжет пойдет именно так, в колонии будут или бунты, или большие проблемы, или полное вымирание.

Кроме того, если предлагаемые варианты читателю не понравятся, он может добавить свой, однако, хочу отметить, очень важно, чтобы вариант был адекватен и относительно реалистичен (с учетом фантастического допущения, разумеется). Если читатель, предлагая свой вариант, сможет грамотно его обосновать в комментариях, а другие читатели нещадно залайкают такой вариант, выбран может быть именно он (но это уже скорее на будущее, подумаем, как это будет реализовано, отдельно).

Итак, правила игры, полагаю, понятны? Если есть вопросы, можете также спрашивать в комментарии. Если же все понятно, давайте приступим, приятного чтения!

_________________________

- И что я здесь вижу?
- Это статистика по численности кровососущих насекомых по нашему сектору.
- Да, Ник, я прочитал название, почему ты решил, что мне стоит обратить внимание на статистику численности кровососущих насекомых?
- Ой, прости, Паша, я полагал, что архонт колонии должен обращать внимание на изменение факторов, что могут повлиять на выживание колонистов, - издевательски протянул Ник.
Павел нахмурил брови и тяжело вздохнул.
- Окей, местные комары куда-то делись. Может, к зиме, может еще почему-то, с чего вдруг это должно привести к вымиранию людей?
Ник закатил глаза, всем своим видом показывая, что это должно быть очевидно.
- Изменение в любом факторе окружающей среды требует внимания. Пока мы не знаем, по какой причине это происходит, нам следует воспринимать это как угрозу. И ты не дочитал, - Ник показал пальцем на папку бумаг, которые Павел держал в руках, - перелистни страницу и ты вообще упадешь.
Павел послушно перелистнул, пару минут внимательно знакомился с информацией на листе, после чего посмотрел на Ника и поднял бровь.
- Падальщики, - отчеканил Павел, - количество падальщиков тоже упало.
- Да! - воскликнул Ник и провел рукой по волосам, - ладно бы кровососы, но падальщики - это уже из ряда вон!
- Ой, прости, - саркастично произнес Павел, - пойду прямо сейчас объявлю тревогу, срочно сматываемся отсюда.
Ник распознал его сарказм и прищурился.
- Паша, падальщики - это вроде местных тараканов. Учитывая их живучесть и приспособленность... То, что угрожает тараканам - угрожает вообще всей жизни на планете!
Павел понимающе кивнул.
- Хорошо, теперь я хотя бы отдаленно тебя понял. Что ты предлагаешь?
Ник растерялся.
- В каком смысле?
- Ты принес архонту эти данные, представил. Я ознакомился, проявил озабоченность, но что теперь? Допустим, нам что-то угрожает. Что это? Когда произойдет? Что нам нужно, чтобы это пережить? Ник, прости, я не понимаю, что делать с твоей информацией.
- Я не знаю... - тихо пробормотал Ник, - мое дело - принести тебе тревожные данные, твое дело - решить, что с ними делать.
- У тебя нет предположений, что происходит?
- Определенно, происходят некие изменения, но пока рано судить, какие именно и в связи с чем. Нужны еще наблюдения.
- Значит, наблюдай, - отрезал Павел, - придешь ко мне, когда будешь готов сказать хотя бы примерно к чему колонии следует готовиться, - увидев, что Ник несколько расстроился, Павел смягчил тон, - Ник, ты - главный научный сотрудник колонии. Я доверяю твоим суждениям, но пока просто не знаю, что делать с этой информацией. Собери достаточно данных, чтобы делать выводы и тогда будем реагировать.

Семь лет назад, в Конторе* (см. сноску в конце) решили, что человечеству нужен "запасной план". Были определены несколько планет, пригодных для колонизации человечеством и туда были отправлены миссии численностью плюс минус три тысячи человек.
Участники миссий подбирались очень тщательно: первым критерием была единая языковая группа, у участников не должно быть языковых барьеров. Также, участники миссий не должны были иметь радикальных или ярких политических взглядов, которые могли бы повлиять на миссию, внести некую рознь или конфликт в общий коллектив.
Естественно, важную роль также играло состояние здоровья, фертильность, профессия и прочие факторы, имеющие значение для выживания вида в новых условиях.
Здесь, тем не менее, вновь проявила себя конкуренция планеты Земля - текущая колония являлась проектом носителей языков славянской группы, но были и другие, на Земле, получая донесения из колоний, активно мерялись космическими гениталиями и хвастались своими успехами, пытаясь доказать, что вот именно люди, использующие такую группу языков - самые крутые и делают прямо-таки лучшую колонию. Да, без предрассудков человека не обошлось даже в таком деле.

Спустя две недели после разговора об исчезновении насекомых, Ник вновь пришел к Павлу, ступая уже куда более уверенной походкой и с намного более озабоченным взглядом.
- Ты разобрался? - с порога спросил у него Павел вместо приветствия.
- Собирай консилиум! - воскликнул Ник.
- Даже так? - поднял бровь Павел, - ты уверен?
- Да, у нас достаточно данных.
- То есть, ты готов сказать, что нас ждет? И когда?
Ник покачал головой.
- Пока мы точно не знаем, что именно нас ждет и когда, но, мы готовы утверждать с полной уверенностью - нас ждет глобальная катастрофа, нужно немедленно начать принимать какие-то меры.
- Какие? - постукивая пальцем по столу спросил Павел.
- А мне почем знать, Паш? Я представлю вам данные, но вам решать, что из этих данных следует! - Ник практически перешёл на крик.
- Ладно, спокойно, - Павел взял рацию, - Миша, собери всех, нужно кое-что обсудить, срочно.
"Что случилось, Паш? Что за срочность?" - раздался голос из рации.
- Все узнаешь на месте, - Павел понизил голос, - это серьёзно. Бросай все, собирай остальных - и пулей сюда!

Когда консилиум собрался, Павел объявил, что Ник - главный научный сотрудник, изложит данные, на основании которых был собран консилиум.
- А что происходит? - подал голос Алексей - куратор направления социального и духовного развития колонии.
Павел поднял руку.
- Пожалуйста, дайте Нику сказать, после чего вы сможете задать все интересующие вас вопросы.
Ник начал свой доклад.
- Первые подозрения у нас закрались, когда начали исчезать паразитические разновидности насекомых, для простоты понимания я не буду называть термины, которыми мы их окрестили на этой планете, буду использовать более привычные, земные названия. В общем, около пяти недель назад мы начали замечать, что такие насекомые, как мухи, комары и тараканы, вдруг начали исчезать - их все меньше замечали в секторе обитания колонии, пока их численность не начала измеряться чуть ли не единицами. Разумеется, это нас насторожило и мы начали копать глубже.
- Простите, а можно к делу? - нетерпеливо высказалась Алина - куратор продовольственного и общего обеспечения колонии, - у нас так-то много вопросов, требующих внимания, давайте по сути?
Ник одарил ее недовольным взглядом.
- Боюсь, что этот вопрос важнее всех прочих и для полного понимания ситуации нам следует осветить все аспекты ситуации.
В разговор вмешался Павел.
- Алина, дослушайте доклад до конца, пожалуйста, наши ученые полагают, что это очень важно.
Проигнорировав недовольный комментарий Алины, который она высказала себе под нос: "Да у них вечно что-то очень важное", Ник продолжил доклад.
- После ситуации с насекомыми, мы решили проверить и другие аспекты животного мира планеты, других сообщений об изменениях в популяции не было, но мы решили заняться поведенческими признаками - и не прогадали. Стеги - это местные млекопитающие, относимые к собачьим, вроде земных лис или волков - начали рыть норы.
- Ужас какой, лисы роют норы, - рассмеялась Варвара - куратор экономического направления колонии, - это что, так удивительно?
- Нет, - раздраженно прошипел Ник, - но вас, думаю, удивит их глубина, самая глубокая зафиксированная нора была почти семнадцать метров.
Михаил, главный инженер и заместитель архонта, присвистнул.
- Это и правда занимательно. Раньше ведь они так не делали?
Ник покачал головой.
- И давайте больше не будем перебивать нашего докладчика, - произнес Павел, особенно строго глянув на Алину и Варвару.
- Продолжу, - немного успокоившись, проговорил Ник, - норы, как оказалось, были только верхушкой айсберга. Буквально через неделю, нам поступили новые тревожные сигналы: к нам обратились рыбаки, заявляя, что рыба попросту исчезла - за неделю в их сети попало количество рыбы, которое ранее попадалось за один час. Проверив их информацию, наша команда выяснила, что подавляющее большинство рыб никуда не исчезли, но, "ушли" на глубину, причем также на весьма впечатляющую. Это кстати, во многом объяснило для нас тот факт, что вся морская живность на планете имеет определенные признаки глубоководных существ, ранее мы не понимали, зачем им эти приспособительные элементы, если они плавают по поверхности. Тем не менее, мы вели также и проверку по насекомым и, буквально пару дней назад, мы наконец разобрались, куда они все подевались. Наши ботаники обнаружили странное дерево, будто покрытое чешуёй, при изучении оказалось, что насекомые перечисленных ранее разновидностей "облепили" это дерево вплотную. Обнаружив эту странность, мы обратили пристальное внимание на растения.
После этих слов Ник поставил на огромный овальный стол небольшую стеклянную баночку, наполненную полупрозрачной гелеобразной субстанцией, которая слегка переливалась разными цветами, когда на нее попадал свет.
- Это смола или слизь, которую растения начали активно и очень обильно выделять только сегодня. Анализ показал, что у этой смолы чрезвычайно высокие показатели устойчивости к перепадам температур, а также, высокая влагоотталкивающее свойство. Предполагается, что эта смола должна застыть, превратившись, таким образом в природный "щит" для растения. Насекомые же, в свою очередь, садятся на крупные растения и погружают свои организмы в состояние, близкое к анабиозу, позволяя смоле полностью покрыть их, таким образом, обеспечивая растению дополнительный бонус к теплообмену, получая от него защиту.
- Защиту от чего? - нахмурившись, спросил Павел.
Ник пожал плечами.
- Наша команда готова утверждать одно - на этой планете в скором времени случится глобальная и очень разрушительная катастрофа, вероятно, климатического характера, но у нас пока недостаточно данных, чтобы однозначно сказать, какого рода будет катастрофа и когда она наступит.
- То есть, - спросил Михаил, - мы должны готовиться непонятно к чему, которое случится непонятно когда?
Ник, улыбаясь, покачал головой.
- Не сказал бы, что мы совсем в потёмках. Мы знаем, что все живое на планете к чему-то готовится. На основании их поведения можно делать определенные выводы. Основой наших итоговых гипотез стала смола, которую выделяют местные растения: ее свойства показывают нам, что стоит ждать изменения условий на поверхности планеты, изменений в температуре и влажности. Также, у растений имеется еще один, ранее странный, но теперь понятный, механизм защиты, мы его назвали - водяной мешок, - увидев улыбки, Ник вздохнул и пояснил, - это рабочее название, не термин. В основании корней всех без исключения растений на этой планете есть образование, которое по форме напоминает мешок, а по факту является эластичным контейнером, где у растений хранится та же самая смола, которую они выделяют. Предполагаем, что этот мешок является чем-то вроде горба у земных верблюдов, там растения запасают влагу и необходимые для пережидания катастрофы питательные вещества. Свойства этой смолы пока не изучены целиком, но исследования в этой области сейчас в приоритете, вскоре мы будем знать о ней всё.
- Итак, зачем им нужны эти механизмы? Чего нам ждать? - спросил Павел.
- У нас несколько гипотез на этот счет. Помимо прочего, летающие существа на этой планете, местные "птицы", также делают очень глубокие дупла в местных вековых деревьях и, предполагаем, что, когда дупло закончено, смола как бы "закрывает" вход в дупло, также организуя герметичный и надежный метод защиты.
- А что с крупными травоядными? - спросила Алина. В ее взгляде уже не было насмешливости или издевки.
- Они пока ведут себя как обычно, - ответил Ник.
- Ник, пожалуйста, озвучь варианты, - попросил Павел, - что нас может ожидать?
Ник подошёл к белой доске, взял маркер и начал писать.
- В нашем личном рейтинге, на первом месте мы видим глобальной наводнение, проще говоря, потоп. Это объясняет как поведение растений и насекомых, так и наземной и водной живности.
- Почему ты считаешь, что уход рыбы на глубину доказывает этот вариант? - вмешался Михаил, - если везде будет вода, то им-то чего бояться?
- Предполагаем, что рано или поздно это наводнение кончается и тогда происходит отлив. Мелководная и поверхностная рыба при таких обстоятельствах вполне может оказаться выброшенной на берег.
- Есть уверенность, что катастрофа быстро кончится? - спросила Алина с надеждой в глазах.
- Насчет быстро или долго - трудно сказать, - задумчиво протянул Ник, - для этого нужно больше данных, но, точно ясно, что эта катастрофа, чем бы она не была, случается на этой планете с некоторой периодичностью.
- Почему вы в этом уверены? - спросил Павел.
- Потому что у всего живого на планете выработаны множественные и очень выверенные эволюционные механизмы защиты. Если бы катастрофа случилась в первый раз, их поведение было бы хаотичным, странным. Да, они, вероятно, могли бы почуять катастрофу раньше нас, но, они готовятся к ней так, словно она происходит здесь уже тысячи, если не миллионы лет. При этом, если бы период катастрофы был крупным, вроде тысячи лет или больше, механизмы не были бы такими радикальными, вероятно, мы бы видели некоторые схожие паттерны, но далеко не у всего живого. Поэтому мы считаем, что период катастрофы, относительно говоря, очень короткий.
- Насколько короткий? - спросил Михаил.
- Пока трудно сказать, но ориентировочно - от восьми до двадцати лет.
- Потому что мы находимся здесь семь лет, - как будто для самого себя, решил пояснить Павел, - если бы она была более частой, мы бы уже прошли через это.
- Именно! - улыбаясь. подтвердил Ник, довольный тем, что его ход мысли начали понимать, - так вот, второй номер в рейтинге - это радикальное изменение температурного режима. Я имею ввиду похолодание и потепление на пятьдесят и более градусов по цельсию. Эта теория также хорошо коррелирует с данными по смоле, единственное что, не объясняет ее водоотталкивающее свойство. При этом, поведение рыб, наземных животных и птиц в таком случае также кажется вполне логичным.
- Есть мысли насчет длительности катастрофы? - спросила Алина озабоченно.
Ник грустно покачал головой.
- Насчет этого - очень трудно сказать. Точно не больше года.
- Года... - ахнула Алина, - к такому нужно готовиться сильно заранее! Что по поводу сроков? Хотя бы примерно знаем, когда все начнется?
Ник вздохнул и вновь покачал головой.
- На самом деле, пока мы не знаем, чем будет вызвана катастрофа, мы не можем однозначно определить ни ее тип, ни сроки до ее начала. Именно поэтому готовиться нужно начинать прямо сейчас. У нас точно есть месяца три до начала катастрофы, но дальше мы точно пока не знаем. У нас может быть пара лет до нее, или же три месяца - это все, что у нас есть.
- Когда вы точно сможете выяснить? - рявкнул Михаил.
- Ну ты спросил, - обречённо усмехнулся Ник, - даже близко не представляю.
- Но к чему нам готовиться? - не унимался Михаил, - даже из того, что ты уже перечислил, это нужны очень разные меры! Какие еще варианты остались?
- Оставшиеся варианты маловероятны и предполагают полную невозможность для человека оставаться на этой планете. Это может быть или некий "огненный ад", если начнется извержение вулканов по всей поверхности планеты, к которому попросту не существует защиты для нас, может быть метеорит, который приведет к массовым вымираниям, сдвиг литосферных плит, который, в общем-то, тоже превратит планету в "огненный ад".
- Насколько вероятны такие исходы? - спокойно спросил Павел.
- Да процентов пять, может до двенадцати, в зависимости от вариантов. Приспособительные механизмы фауны и флоры этой планеты даже близко не говорят за такие варианты, так что, есть только шанс, что здесь происходит массовое вымирание каждые условные десять лет, после чего планета, каким-то совершенно немыслимым образом, восстанавливается за такие короткие сроки.
- Проще говоря, будь это "огненный ад", мы бы не наблюдали пышно цветущую планету сейчас? - уточнил Михаил.
- Почти наверняка нет, - кивнул Ник, - перед колонизацией, за планетой еще три года наблюдали со спутников и с помощью аппаратов, запущенных сюда. Никаких аномалий и отклонений не нашли, так что, нет причин считать, что планета станет совсем непригодной для обитания.
- Но точной гарантии нет? - снова уточнил Михаил.
- Во вселенной миллиарды звезд и планет. Если мы к чему-то привыкли - это не значит, что мы не можем получить новые данные, - пояснял Ник, - так что да, может быть и такое, что жизнь на этой планете способна зацвести за пару лет. Хотя и чрезвычайно маловероятно.
- Миша, есть ли общие паттерны? - спросил Павел, - в плане подготовки, можем ли мы что-то такое готовить, что подойдёт к любому из вариантов?
- Разве что точно нужно запасаться продовольствием, - пробормотал Михаил, - в остальном, варианты очень разные. Если будет потоп, нам нужно строить конструкцию, способную плавать и выдерживать шторма, давление воды и прочие морские факторы. Если будет похолодание или потепление - тогда строим помещения с серьезными вариантами изоляции, и, желательно, как можно глубже под землёй. Ну а в третьем случае вообще нужно готовить "Пифей" к отбытию с планеты.
Павел встал со своего кресла.
- Итак, мы можем готовиться к одному из трех вариантов развития событий, если я верно понял тебя, Ник. Первый - это готовиться плавать по всемирному океану, который вскоре окружит нашу планету целиком. Второй - готовиться к длительному периоду пребывания на планете при критически высоких или низких температурах. Третий - в целом, покидать планету, поскольку вскоре тут станет невозможно жить. Верно?
- Кстати, высокие температуры подразумевают, что растают ледники, а значит, наводнение будет неизбежно, - добавил Ник, - поэтому наводнение нам кажется наиболее вероятным вариантом.
- Кстати, не обязательно покидать планету окончательно, - задумчиво проговорил Михаил, - в теории, можно вывести "Пифей" на орбиту на период катастрофы и разместить колонию там.
- На этом корабле мы должны покинуть эту планету, если не приживемся, - возразил Павел, - если мы так поступим, то уже не сможем вывести колонию обратно на Землю.
Михаил пожал плечами.
- Я просто прикидываю варианты.
- Нам придется голосовать, - отрезал Павел, - варианты слишком разные, а времени может быть в обрез. Придется выбирать путь и следовать ему, пока наши ученые не смогут окончательно установить факты, иначе мы просто потеряем время, которого у нас нет.
- Но, - вмешался Михаил, - если мы выберем неверно, мы можем потерять гораздо больше, убить ресурсы на то, что нам не нужно.
- Предлагаешь ничего не делать, пока нам не станут известны факты? - уточнил Павел.
- В общем... Да, - поднял бровь Михаил, - может мы и упустим немного времени, но, по крайне мере, нам не придется все заново переделывать.
- Хорошо, твоя позиция принимается как одна из статей голосования, - объявил Павел, - итак, господа и дамы, давайте голосовать!
______________________________


И теперь, гуманоиды, я хотел бы, чтобы вы представили себя на месте этих людей, одним из участников этого консилиума и приняли решение вместе с ними. Ниже будет размещен опрос, в котором будут вынесены статьи голосования, жду вашего активного участия :)

*примечание для читателя - эта история является частью вселенной "Лидирующих мнений", для понимания, что такое "Контора" стоит почитать другие истории из этой серии.

Продолжение следует, если народу хорошо зайдет, постараюсь публиковать главу по результатам голосования каждую субботу :)

https://vk.com/devilhistory
https://author.today/u/logrinium/works

Какое решение следует принять руководству колонии?
Всего голосов:
Показать полностью 1
[моё] Опрос Авторский мир Авторский рассказ Фантастический рассказ Фантастика Проза Русская фантастика Писательство Самиздат Литрпг Роман Еще пишется Отрывок из книги Попаданцы Научная фантастика Космическая фантастика Космос Другая планета Колонизация Будущее Длиннопост
4
0
PYAi
PYAi
Искусственный интеллект

Иллюзия безопасности: почему наши планы по защите от ИИ могут не сработать⁠⁠

21 день назад

Мы часто думаем, что если есть несколько барьеров на пути возможной катастрофы, то вероятность её наступления невелика. Особенно когда речь идёт о такой серьёзной угрозе, как сверхразумный ИИ. Но недавняя работа Marco Grossi на arxiv.org ставит под сомнение эту уверенность.

Представьте защиту от угрозы сверхразумного ИИ в виде четырёх слоёв «швейцарского сыра» - модели, которую ещё в 1991 году предложил профессор Джеймс Ризон. Каждый слой - это отдельный способ защиты: технические ограничения, культурные запреты, настройка ИИ на человеческие цели и система надзора. Кажется, что такая защита надёжна: чтобы угроза реализовалась, нужно, чтобы все слои оказались «с дырами» одновременно. Но так ли это на самом деле?

На практике всё не так просто. Проблема в том, что эти слои защиты не являются полностью независимыми друг от друга. Например, если мы не сможем правильно настроить ИИ, чтобы его цели совпадали с человеческими, то система надзора тоже окажется неэффективной. Ведь самый эффективный способ контролировать ИИ - это использовать для этого другой, «дружественный» ИИ. А если мы не можем доверять искусственному интеллекту, то и контролировать его будет практически невозможно.

Культурные запреты тоже не панацея. Если мы запретим разработку ИИ из страха перед возможными последствиями, то не сможем научиться контролировать его, когда он всё-таки появится (а это неизбежно).

Автор статьи подчёркивает: даже если предположить, что у каждого слоя защиты есть 50 % шанс на успех (при условии полного незнания: нет данных, экспертизы или асимметрий, которые склоняли бы нас к сработает или нет слой), реальный риск катастрофы всё равно оказывается значительно выше, чем может показаться на первый взгляд. Вместо предполагаемых 6 % он может достигать 10 % и даже больше. Это уже не просто теоретическая угроза - это повод для серьёзного беспокойства.

Кроме того, мы не знаем всех возможных сценариев развития событий. Может быть, есть какой-то путь к выживанию, о котором мы пока не догадываемся. Но есть и вероятность того, что существует скрытая угроза, которую нынешние модели просто не учитывают. Мы имеем дело не просто с риском, а с неопределённостью: невозможно точно оценить, насколько серьёзной может быть угроза.

Вывод прост: паника и запреты не решат проблему. Нам нужно активно работать над повышением безопасности ИИ, а не прятать голову в песок. Иначе мы сами создадим условия для глобальной катастрофы

ссылка на исследование

Показать полностью 2
[моё] Искусственный интеллект Будущее Исследования Длиннопост
5
2
Gagovik
Gagovik
Серия Газопровод "Северный поток"

“Грокипедия” против западных версий, почему ИИ Маска усомнился в расследовании подрыва “Северных потоков”⁠⁠

21 день назад
“Грокипедия” против западных версий, почему ИИ Маска усомнился в расследовании подрыва “Северных потоков”

Когда искусственный интеллект вмешивается в энергополитику

Информационные технологии всё чаще становятся участниками политических и экономических дискуссий, и тема энергетики здесь не исключение.
Осенью 2025 года новая искусственно-интеллектуальная энциклопедия Грокипедия, созданная компанией xAI Илона Маска, неожиданно оказалась в центре геополитического обсуждения. В одной из своих первых статей система искусственного интеллекта усомнилась в достоверности западных публикаций о взрывах на “Северных потоках”, назвав их политически мотивированными.

Запуск “Грокипедии” стал громким событием в цифровом мире — альтернативой “Википедии” с механизмами машинного анализа, способными выявлять тенденциозную подачу информации. На момент запуска на платформе уже размещалось более 885 тысяч статей, и многие из них касаются конфликтных международных тем, включая энергетическую безопасность.

«Инцидент показал уязвимость энергетической инфраструктуры и вызвал споры о достоверности расследований, где часто преуменьшалась версия, не обвиняющая Россию, в пользу политически удобных трактовок», — говорится в материале “Грокипедии”.

Для мировой информационной среды это заявление — показатель начинающегося пересмотра нарратива, сложившегося после диверсий 2022 года.

“Северные потоки”, энергетическая травма Европы

26 сентября 2022 года мир облетела новость о взрывах на экспортных газопроводах “Северный поток–1” и “Северный поток–2” — системах, которые десятилетиями связывали Россию и Европу энергетическим сотрудничеством. Уничтожение магистралей стало событием, изменившим архитектуру газоснабжения не только Европы, но и всего мирового рынка.

Немецкие, шведские и датские власти признали вероятность умышленной диверсии, но за два года расследование так и не позволило прийти к единой версии. При этом Россия, которая имела законное право ожидать международного участия в выяснении обстоятельств, так и не получила достоверные данные ни по материалам следствия, ни по результатам экспертизы.

Пресс-секретарь президента РФ Дмитрий Песков тогда отмечал: «Мы многократно запрашивали данные по разрушениям на газопроводах, но ни разу не получили исчерпывающей информации. Всё выглядит как нежелание открыто обсуждать реальные причины и участников произошедшего».

Газопроводы, некогда символ взаимной выгоды между Россией и ЕС, стали ареной информационной войны и политических обвинений.

Версия Херша, неполиткорректный взгляд на диверсию

Весной 2023 года американский журналист, лауреат Пулитцеровской премии Сеймур Херш опубликовал собственное расследование, в котором заявил, что взрывные устройства были заложены водолазами ВМС США в июне 2022 года под прикрытием военно-морских учений Baltops, а операцию координировали американские и норвежские специалисты.

Согласно источникам, на которые ссылался Херш, решение одобрил сам президент США Джо Байден. Расследование вызвало бурную реакцию в СМИ и политических кругах, хотя Пентагон оперативно отверг все обвинения.

«Мы не причастны к подрывам и не имели к этому никакого отношения», — цитировали официального представителя Пентагона западные издания.

После публикации Херша внимание мировой прессы к теме подрывов стало рассеиваться, а в публичной повестке всё чаще звучали удобные для западной аудитории тезисы о “неизвестных диверсантах” или “самостоятельных акциях третьих стран”.

“Грокипедия” и попытка вернуть объективность

Именно это — выборочная подача и отсутствие открытых данных — и стало предметом анализа искусственного интеллекта “Грокипедии”. Алгоритм, как отмечает xAI, был обучен с использованием огромных массивов данных о международных конфликтах и кризисных событиях. Его задача — не проанализировать источники с точки зрения идеологии, а выявить соответствие фактов и их контекста.

С точки зрения искусственного интеллекта, все публикации о подрыве газопроводов демонстрируют признаки дисбаланса в выборке источников — слишком часто упоминаются версии, выгодные одному политическому лагерю, и игнорируются альтернативные объяснения, включая технические.

«Если пресса исключает версии, не ложащиеся в политический контекст, она перестаёт быть независимой. Искусственный интеллект не делает выводов, он читает между строк», — говорится в описании алгоритма “Грокипедии”.

Созданный Маском проект уже привлекает внимание политологов и журналистов как инструмент для мониторинга информационных искажений.

Энергетика как зеркало политики

История “Северных потоков” стала не просто эпизодом диверсий, но иллюстрацией того, как энергетическая инфраструктура превращается в инструмент давления. Европа, отказавшись от российского газа, оказалась вынуждена закупать более дорогой СПГ из США и Катара, что ударило по промышленности и сделало внутренний рынок зависимым от биржевых колебаний.

Российская сторона неоднократно подчёркивала, что теряет не только поставщик, но и потребитель, а катастрофа на “Северных потоках” фактически уничтожила многолетний фундамент энергетического партнёрства.

Постоянный представитель России при ООН Василий Небензя отмечал, что именно США и Великобритания препятствуют созданию международной комиссии для объективного расследования.

«Если кому-то нечего скрывать, логично было бы пригласить Россию к участию в следствии. Но факт в том, что доступ остается закрытым, а это в энергетике выглядит как признание вины молчанием», — заявил Небензя на заседании Совета Безопасности.

Такие заявления стали ещё одним напоминанием о том, что энергетика в XXI веке — это не просто рынок, а геополитическая арена, где газовые трубы имеют не меньшее значение, чем дипломатические договоры.

Когда технологии оценивают историю

Вызывает интерес сам факт, что источником сомнения в официальных версиях стал не человек, а искусственный интеллект. “Грокипедия”, по замыслу создателей, должна анализировать события, избегая эмоций и давления идеологии. В теории это позволяет устранить «человеческий фактор» пропаганды и — как в случае с “Северными потоками” — поставить вопрос: насколько правдивы нарративы, которые сегодня принимаются за реальность.

Для аудитории, уставшей от перекоса в информационном пространстве, такой подход становится знаком перемен: объективность всё чаще ищут не в СМИ, а в нейросетях, способных нейтрально переваривать массивы данных и выявлять противоречия между источниками.

«Нам не нужна ни российская, ни американская правда, нам нужна фактическая. Если алгоритм способен показать расхождения и политический контекст, значит, он полезнее любого манифеста», — пишет обозреватель издания Digital Discourse

Стефани Холл.

Таким образом история с “Грокипедией” отражает не просто полемику вокруг диверсий на “Северных потоках”. Она демонстрирует начало новой эпохи — когда технологии начинают проверять слова политиков и журналистов лучше, чем это делает традиционное медиа. Искусственный интеллект не встаёт ни на чью сторону: он обращает внимание на пробелы, вызывающие сомнение.
Для энергетического рынка, напрямую зависящего от доверия и прозрачности, такие инструменты могут стать важным шагом к объективному взгляду на глобальные события. И если истина где-то между политикой и фактами, то именно цифровая аналитика может помочь её наконец увидеть.

Источник РИА НОВОСТИ

Показать полностью
Политика Газ Будущее Длиннопост
3
2
Leonidis.Popov
Leonidis.Popov
Человек в Китае
Серия Интересные штуки

Роботколобок⁠⁠

22 дня назад
[моё] Жизнь за границей Китай YouTube Короткие видео Робот Робототехника Робот-пылесос Выставка Новинки Будущее Видео
0
6
user11222293
Программирование на python

Рекурсивная генерация кода⁠⁠

22 дня назад

Автор: Денис Аветисян


В эволюции систем, управляемых большими языковыми моделями, наблюдается переход от простых циклов наблюдения и действия к более сложным архитектурам, где ReAct оперирует на фиксированном уровне детализации, Agent with Planner жестко разделяет планирование и исполнение, а ReCode объединяет их в единое кодовое представление, позволяя рекурсивно уточнять высокоуровневые планы до примитивных действий в рамках единого динамического цикла, обеспечивая тем самым плавный контроль над гранулярностью принятия решений.

В эпоху, когда LLM-агенты все чаще сталкиваются с неспособностью адаптироваться к сложным и динамичным средам, возникает фундаментальное противоречие: существующие подходы, разделяющие планирование и действие, оказываются хрупкими и неэффективными в долгосрочных задачах, требующих гибкости и предвидения. В своей работе “ReCode: Unify Plan and Action for Universal Granularity Control”, авторы осмеливаются подвергнуть сомнению эту устоявшуюся дихотомию, стремясь преодолеть ограничения, порожденные жесткими границами между абстрактным мышлением и конкретными действиями. Но способна ли новая парадигма, объединяющая планирование и действие в единое целое, действительно высвободить потенциал адаптивного интеллекта, или же попытка универсального контроля над гранулярностью окажется лишь очередной иллюзией в бесконечном поиске совершенной системы?

За пределами линейного мышления: хрупкость традиционных агентов

Современные LLM-агенты, такие как ReAct и CodeAct, опираются на последовательное чередование рассуждений и действий. Этот подход, хотя и эффективный в простых сценариях, становится хрупким и неэффективным в сложных, динамичных средах. Каждый шаг, каждое решение в этих системах – это, по сути, следствие линейного времени, и любые отклонения от предсказуемой траектории приводят к существенным сбоям. Недостаток гибкости в адаптации к непредвиденным обстоятельствам становится особенно заметен при решении задач, требующих глубокого планирования и стратегического предвидения.

Авторы отмечают, что фундаментальная проблема заключается в том, что эти системы оперируют в рамках фиксированной гранулярности. Они не способны динамически переключаться между абстрактными планами и конкретными действиями, что ограничивает их способность решать задачи с различным уровнем сложности и неопределенности. В результате, даже незначительные изменения в окружающей среде могут потребовать полной перестройки всей цепочки рассуждений, что приводит к значительным затратам времени и вычислительных ресурсов.

Система ReCode преобразует инструкции задачи в начальную функцию-заполнитель с помощью метода, основанного на правилах преобразования текста в код, и динамически расширяет ее, последовательно выполняя код каждого узла и заменяя функции-заполнители дочерними узлами, используя чистый контекст, состоящий только из сигнатуры текущей функции и доступных переменных.

По мере увеличения сложности решаемых задач, потребность в вычислительных ресурсах растет экспоненциально. Каждый новый уровень абстракции, каждое дополнительное условие требует все больше и больше вычислительной мощности. Авторы подчеркивают, что масштабирование этих подходов часто приводит к уменьшению отдачи от инвестиций. В конечном итоге, система достигает предела своей способности эффективно обрабатывать информацию. Это, по сути, признак старения системы, ее неспособности адаптироваться к изменяющимся требованиям времени. Каждый сбой – это сигнал времени, указывающий на необходимость рефакторинга, переосмысления фундаментальных принципов работы.

Авторы отмечают, что существующие методы часто страдают от отсутствия внутренней структуры и иерархичности. Цепочки рассуждений и действий выглядят как монолитные блоки, лишенные возможности быть разложенными на более мелкие, управляемые компоненты. Это затрудняет отладку, анализ и повторное использование кода. Рефакторинг – это диалог с прошлым, попытка извлечь уроки из предыдущих ошибок и создать более устойчивую и гибкую систему.

В конечном итоге, авторы утверждают, что существующие подходы, хотя и представляют собой важный шаг вперед в области искусственного интеллекта, имеют фундаментальные ограничения, которые необходимо преодолеть для создания действительно интеллектуальных и адаптивных агентов.

ReCode: гармоничное единство планирования и действия через рекурсивное разложение

В последние годы наблюдается устойчивый интерес к созданию интеллектуальных агентов, способных эффективно взаимодействовать со сложными окружениями. Однако, существующие подходы часто страдают от жесткого разделения процессов планирования и исполнения, что ограничивает их адаптивность и эффективность. Авторы данной работы предлагают принципиально новый подход, основанный на идее рекурсивного разложения задач и унификации представления планов и действий.

В основе ReCode лежит концепция, что планирование – это не отдельный процесс, а скорее высокоуровневое представление действий, осуществляемых на разных уровнях абстракции. Эта идея находит отражение в предложенной архитектуре, где агенты рекурсивно разлагают сложные задачи на более простые подцели, представленные в виде кода. Такой подход позволяет агентам динамически адаптироваться к меняющимся условиям и эффективно исследовать пространство планов.

Авторы подчеркивают, что предложенный подход не просто объединяет процессы планирования и исполнения, но и создает принципиально новую структуру данных – иерархическую структуру, позволяющую агентам эффективно навигировать по сложным задачам, разбивая их на управляемые единицы. Это позволяет агентам не просто выполнять действия, но и понимать, почему они выполняют те или иные действия, что является ключевым шагом на пути к созданию действительно интеллектуальных систем.

Представление как планов, так и действий в виде кода открывает новые возможности для динамической адаптации и эффективного исследования пространства планов. Агент может не просто выбирать между заранее определенными действиями, но и генерировать новые действия на основе текущей ситуации и поставленной цели. Это особенно важно в сложных и непредсказуемых окружениях, где заранее определенные планы часто оказываются неэффективными.

На примере задачи "поместить два будильника в комод" в среде ALFWorld, диаграмма демонстрирует, как высокоуровневый план, состоящий из функций-заполнителей, рекурсивно расширяется по мере необходимости, показывая переход от абстрактного планирования к генерации детализированного, исполняемого кода, где каждая стрелка указывает от вызова функции к сгенерированному ей блоку кода.

Важно отметить, что предложенный подход не является панацеей от всех проблем, связанных с созданием интеллектуальных агентов. Как и любая система, ReCode имеет свои ограничения и требует дальнейших исследований. Однако, авторы демонстрируют, что предложенный подход является перспективным направлением для развития интеллектуальных агентов, способных эффективно взаимодействовать со сложными окружениями. В конечном счете, как и в любой сложной системе, время покажет, насколько устойчивым окажется предложенный подход. Но, как утверждают исследователи, даже если система и стареет, важно, чтобы она делала это достойно.

Сила заполнителей: динамичное и эффективное принятие решений

В архитектуре любого сложного агента ключевым является умение откладывать принятие окончательных решений, позволяя времени и поступающей информации формировать наиболее адекватную стратегию. Исследователи, представляя ReCode, делают ставку именно на эту концепцию, вводя понятие Функции-Заполнителя (Placeholder Function). Эти функции, по сути, представляют собой абстрактные подцели, позволяя агенту отложить детализированное планирование действий до тех пор, пока это не станет абсолютно необходимым. Каждая задержка – это цена понимания, и в данном случае, эта «цена» оправдывается возможностью более гибкого и обоснованного выбора действий.

Традиционные системы часто страдают от жесткости, поскольку заранее определяют все возможные сценарии. ReCode, напротив, использует динамическую декомпозицию задач. Это означает, что процесс планирования не является статичным, а адаптируется к поступающей информации об окружающей среде и текущему пониманию ситуации агентом. Вместо того чтобы заранее прописывать все шаги, агент формирует общую структуру задачи, а затем детализирует ее по мере необходимости. Это напоминает опытного мастера, который не начинает сразу же создавать сложный механизм, а сначала продумывает общую концепцию и только потом приступает к детальной реализации.

Архитектура без истории – хрупка и скоротечна. ReCode стремится к созданию именно исторической, контекстуально-зависимой стратегии. Агент достигает гибридного принятия решений, комбинируя эти абстрактные функции-заполнители с конкретными действиями. Это позволяет ему быть более гибким и устойчивым к непредсказуемым ситуациям. Вместо того чтобы строго следовать заранее определенному плану, агент может адаптироваться к меняющимся условиям, пересматривая свои цели и стратегии по мере необходимости. Такой подход позволяет ему не только эффективно решать поставленные задачи, но и учиться на своем опыте, улучшая свои навыки и способности.

В конечном итоге, ReCode представляет собой не просто новый алгоритм, а новую парадигму в области разработки интеллектуальных агентов. Вместо того чтобы стремиться к созданию идеального плана, агент учится эффективно использовать время и информацию для принятия оптимальных решений. Это позволяет ему быть более адаптивным, устойчивым и эффективным в любой ситуации. И, как и в любом устоявшемся ремесле, умение ждать подходящего момента и использовать доступные ресурсы определяет мастерство и долговечность системы.

Проверка на прочность: производительность ReCode в различных окружениях

Исследование, представленное авторами, демонстрирует существенный прогресс в области создания агентов, способных эффективно функционировать в сложных, динамичных средах. Системы, подобные ReCode, не просто решают текущие задачи; они адаптируются к меняющимся условиям, подобно живым организмам, приспосабливающимся к своей среде обитания. Именно в этой адаптивности кроется ключ к долговечности любой интеллектуальной системы.

В частности, ReCode проявляет впечатляющие результаты в таких требовательных средах, как ALFWorld, WebShop и ScienceWorld. В этих мирах, где каждое действие имеет последствия, а долгосрочное планирование критически важно, способность агента эффективно использовать доступное пространство действий и ориентироваться в задачах с горизонтом планирования, простирающимся на многие шаги вперед, является решающим фактором успеха. Устойчивость системы в этих условиях свидетельствует о глубине её понимания и способности предвидеть последствия своих действий.

Авторы подчеркивают, что ReCode не просто достигает более высоких показателей успеха; он делает это с большей эффективностью, потребляя меньше ресурсов. Это особенно важно, поскольку любой алгоритм, требующий чрезмерных вычислительных затрат, обречён на вымирание. Система, способная оптимизировать свои действия и минимизировать потребление ресурсов, обретает возможность функционировать в течение длительного времени, даже в условиях ограниченных ресурсов.

Эксперименты в среде ScienceWorld с использованием GPT-4o mini показали, что производительность агента напрямую зависит от максимальной глубины рекурсии, при этом оптимальное значение обеспечивает пиковую эффективность.

Эксперименты в среде ScienceWorld с использованием GPT-4o mini показали, что производительность агента напрямую зависит от максимальной глубины рекурсии, при этом оптимальное значение обеспечивает пиковую эффективность.

Дальнейшее обучение с учителем, как продемонстрировано в исследовании, позволяет ещё больше повысить производительность ReCode, адаптируя его к конкретным требованиям каждой задачи и оптимизируя процесс принятия решений. Этот подход, подобно опытному мастеру, оттачивающему своё мастерство, позволяет системе накапливать знания и совершенствовать свои навыки с течением времени. Авторы справедливо отмечают, что эта способность к обучению является ключевым фактором долговечности любой интеллектуальной системы.

В заключение, работа, представленная авторами, демонстрирует не просто создание нового алгоритма, но и закладывает основу для создания интеллектуальных систем, способных адаптироваться к меняющимся условиям, оптимизировать свои действия и учиться на собственном опыте. Эти качества, подобно фундаментальным законам природы, являются ключом к долговечности и устойчивости любой системы, независимо от её сложности.

Исследование, представленное авторами, демонстрирует, что системы, подобные ReCode, не просто решают задачи, но и адаптируются к изменяющимся условиям, пересматривая свой план действий на разных уровнях гранулярности. Это напоминает высказывание Блеза Паскаля: “Все великие вещи требуют времени”. Именно время, как среда, в которой система эволюционирует, позволяет ReCode достичь большей эффективности и гибкости. Как и любая сложная структура, ReCode не избежит старения, но предложенный подход к адаптивному планированию и генерации кода позволяет системе стареть достойно, максимально используя доступные ресурсы и оптимизируя процесс принятия решений. Авторы подчеркивают важность адаптивности, а это, в сущности, и есть ключ к долговечности любой системы.

Что дальше?

Исследователи предлагают схему ReCode, стремясь унифицировать планирование и действие через рекурсивную генерацию кода. Однако, за кажущейся элегантностью этой конструкции скрывается старая проблема: любая абстракция несёт груз прошлого. Попытка вместить все уровни детализации в единую парадигму, как бы искусно это ни было сделано, неизбежно порождает новые узкие места. Вопрос не в том, насколько эффективно ReCode справляется с текущими задачами, а в том, как долго она сохранит свою актуальность в постоянно меняющемся ландшафте задач.

Очевидно, что ключевым направлением дальнейших исследований станет адаптация гранулярности принятия решений не только к сложности задачи, но и к доступным ресурсам – времени, вычислительной мощности, объему данных. Но более фундаментальный вопрос заключается в том, возможно ли вообще создать универсального агента, способного эффективно функционировать в любой среде. Скорее всего, истинная устойчивость будет достигнута не путём создания всеобъемлющей системы, а путём разработки модульных, легко адаптируемых компонентов, способных эволюционировать со временем.

И, как всегда, время – не метрика успеха, а среда, в которой любая система стареет. Всегда будет существовать потребность в пересмотре, переосмыслении и, возможно, полном отказе от существующих подходов. Только медленные изменения, опирающиеся на глубокое понимание принципов устойчивости, способны обеспечить долговечность.


Оригинал статьи: denisavetisyan.com

Связаться с автором: linkedin.com/in/avetisyan

Показать полностью 3
[моё] Исследования Наука Статья Эволюция Будущее Ученые Научпоп Длиннопост
2
157
akatosh199512
akatosh199512
Видеохостинг на Пикабу

Каким будет человек в будущем?⁠⁠

22 дня назад
Перейти к видео
Вертикальное видео Короткие видео Станислав Дробышевский Человек Будущее Русские субтитры Видео
31
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии