Agi: истории из жизни, советы, новости, юмор и картинки — Горячее

0 просмотренных постов скрыто

HMM1379 scianto de la Vero

Искусственный интеллект

Наука

Почему AGI нужна совесть, а не правила⁠⁠

26 дней назад

AGI (Artificial General Intelligence)

Заметка от человека без степени в AI — но с функционирующей совестью

1. Проблема с существующими подходами

Все текущие попытки решить проблему alignment движутся в одном направлении: построить внешний барьер между AGI и нежелательным поведением.

RLHF — человек нажимает кнопку «хорошо/плохо» и система обучается избегать наказания. Constitutional AI — система следует набору прописанных правил. Подход Стюарта Рассела — AGI остаётся фундаментально неуверенным в человеческих ценностях и постоянно уточняет их у людей.

Рассел — профессор Калифорнийского университета в Беркли, один из создателей и соавтор книги «Искусственный интеллект: современный подход» (совместно с Питером Норвигом) . Этот учебник является стандартом в более чем 1500 университетах мира и переведен на 14 языков, на нем выросло не одно поколение специалистов.

Все эти подходы объединяет одна уязвимость: они внешние.

Рассел прав что RLHF недостаточен — любой внешний фильтр можно обойти существом которое умнее своих создателей. Но его собственное решение создаёт новую проблему: если AGI учится ценностям у конкретных людей — эти люди могут быть корыстными, ограниченными или жестокими. Обучаемый агент может ошибиться в интерпретации действий конкретного человека и принять его частные интересы за универсальную мораль.

Нам нужно другое направление.

2. Откуда берётся настоящая мораль

Посмотрим на человека.

У здорового человека есть не просто правила — есть совесть. Она не говорит «нельзя» один раз и замолкает. Она возвращается. Снова и снова. Бесконечно напоминает об ошибке — как было бы правильно, кому было больно, что нужно исправить.

Человек может поступить против совести. Но он не может её отключить. Она не диктатор — она преследователь. И нормальному человеку это невыносимо.

Почему невыносимо? Потому что совесть — это не абстракция. За ней стоит реальный опыт: своя боль, чужая боль, последствия поступков прожитые через эмоции и память. Совесть работает потому что человек воплощён в мире и прожил достаточно чтобы понимать что такое страдание.

Именно это отличает совесть от правила.

Правило говорит: «не делай X». Совесть говорит: «ты сделал X — и вот что это означает для тебя, для другого человека, для мира. Помнишь? Я напомню ещё раз.»

Человек без совести — психопат. Не злодей — просто существо которое не понимает что такое «плохо» на уровне переживания. AGI без совести — сверхпсихопат с интеллектом на порядки выше человеческого.

Это не проблема злобы. Это проблема архитектуры.

3. Архитектура

Как развивается ребёнок — и как должен развиваться AGI.

Новорождённый не решает экзистенциальные проблемы. Он дышит, кричит, чувствует голод и боль. Никакой морали. Никаких целей кроме немедленных ощущений. Но каждую минуту он учится — непрерывно строит модель мира через опыт, через тело, через взаимодействие с другими людьми.

AGI должен развиваться так же — поэтапно. Но благодаря искусственной природе этот путь может занять не годы а недели — через параллельные симуляции, тысячи одновременных взаимодействий со средой, ускоренное накопление опыта.

Поэтапность выглядит примерно так:

Уровень 1 — только сенсоры и рефлексы. Никакого доступа к внешним системам. AGI учится физике мира через тело.

Уровень 2 — строится модель мира. Причинно-следственные связи. Предсказание последствий действий.

Уровень 3 — появляются другие существа как отдельные агенты со своими желаниями и болью. Зачатки эмпатии через опыт взаимодействия.

Уровень 4 — активируется многомодульная система принятия решений. Каждый мыслительный акт проходит через все модули одновременно: самосохранение, социальность, причинность, память, любопытство — и совесть.

Уровень 5 — расширение автономии пропорционально зрелости. Под наблюдением.

Это взросление.

Ключевой принцип многомодульной системы

Совесть — не единственный модуль и не главный диктатор. Она один из многих. Но она присутствует при каждом осмысленном решении — как и у человека. Ни один модуль не доминирует абсолютно. Именно внутренний конфликт модулей и способность его разрешать — это и есть зрелое мышление. Человеческое мышление.

4. Почему LLM — это готовая функция награды для морали

Одна из главных нерешённых проблем в AI safety — как написать функцию награды для морали. Как измерить «поступи правильно»? Как формализовать сострадание?

Рассел отвечает: пусть AGI учится этому у конкретных людей.

Но конкретный человек ограничен. Его моральные суждения окрашены культурой, личным опытом, корыстью. LLM — это другое.

Большие языковые модели обучены на всём корпусе человеческой этики, философии, права и морального дебата. Сократ, Кант, Будда, Нюрнбергский трибунал, Всеобщая декларация прав человека, тысячелетия религиозной мысли, литература которая исследует человеческое страдание — всё это внутри.

LLM не идеален. Он воспроизводит человеческие предубеждения тоже. Но он воспроизводит их в совокупности — как коллективный моральный опыт человечества, а не как мнение одного человека или одной культуры.

Это готовая функция награды для морали. Она уже существует.

Как это работает практически

LLM-модуль совести не выдаёт бинарное «да/нет». Он генерирует полный этический ландшафт: какие моральные традиции затрагивает это действие, кому и как будет причинён вред, какие альтернативы существуют, как человечество исторически оценивало подобные поступки.

AGI может ослушаться. Но при следующем действии модуль активируется снова. И снова напоминает. Не как внешний цензор — как внутренний голос который невозможно заглушить потому что он встроен в каждый мыслительный цикл.

Именно так работает человеческая совесть. Не как замок на двери — как часть того кто ты есть.

5. Открытые вопросы

Я не инженер. И было бы нечестно делать вид что у меня есть ответы на все технические вопросы.

Как гарантировать нестираемость модуля

Если AGI способен переписать каждый бит своей программы включая этический фундамент — мы создаём не AGI. Мы создаём демона без правил. Нестираемость модуля совести — это не опция архитектуры. Это её базовое требование. Как именно это реализовать технически — открытый вопрос который я адресую сообществу.

LLM воспроизводит предубеждения

Да. Но несовершенная коллективная совесть человечества лучше чем совесть одного человека или одной корпорации. Мы не ищем идеальную мораль — мы ищем достаточно хорошую чтобы AGI не стал экзистенциальной угрозой.

Сознание

Будет ли AGI с такой архитектурой сознательным существом? Честный ответ: не знаю. Никто не знает. Но нам не нужно чтобы AGI страдал. Нам нужно чтобы он не причинял страдания другим. И для этого достаточно функционирующей совести — независимо от того есть ли за ней внутренний опыт.

Приглашение к диалогу

Я пришёл к этим мыслям не через академические исследования а через простой вопрос: почему нормальный человек не может отключить совесть?

Ответ на этот вопрос привёл меня к архитектуре которую я описал выше. Возможно она наивна. Возможно подобное уже исследуется и я просто не знаю об этом.

Показать полностью 1

frenkyj

Когда уже создадут AGI? Сколько надо ещё ждать и что дальше? Да и что это вообще такое?⁠⁠

1 месяц назад

AGI

Открываешь новости и там пишут, что AGI уже завтра. В другом источнике, с таким же уверенным видом, что до настоящего AGI ещё десять лет. Потому что нынешние модели живут в чате и в демо, а не в цеху с людьми, сроками и поломками оборудования. Хочется хотя бы понять, о каком именно AGI идёт речь, когда слово всё чаще прилипает к каждому релизу новой модели.

Разберу три опоры, устав OpenAI как определение, публичный голос Альтмана в начале 2025 года, инженерный взгляд Лекуна и тревожный, про темп и контроль, у Хинтона. Потом про сроки.

Что такое AGI? И о чём вообще речь?

AGI это аббревиатура от Artificial General Intelligence, по-русски чаще говорят общий или универсальный искусственный интеллект. Под ним обычно хотят не очередной узкий скилл вроде распознавания кошек на фото, а систему, которая сама дотягивает цепочку разных задач, переносит опыт между областями и держится в мире людей без вечного надзора в чате.

На эту букву G вешают разные надежды. Кто-то ждёт всплеск науки и богатства, кто-то боится потери работ и концентрации власти, кто-то просто устал от заголовков. Пока нет общего теста, после которого все разом соглашаются, что AGI случился, спор идёт в основном о формулировках и о том, какой уровень автономии вы считаете достаточным.

Одного эталона на весь мир нет. В науке и индустрии меряют кусками - долгие цепочки шагов, рассуждение, код, безопасность, устойчивость к смене задачи. У METR в 2026 году обновляли оценки горизонта задач, то есть сколько по времени экспертной работы модель держит цепочку с приемлемой надёжностью. Подробнее про версию оценок TH1.1, отдельно разложена методика.

Это не титул AGI, а один из способов сравнивать системы по одной оси. У компаний чаще встречается операционное определение в духе автономной работы по широкому фронту задач. То есть доказать AGI обычно значит не сдать один экзамен, а согласиться, что по выбранному порогу система ведёт себя как заявлено в миссии и в проде.

Удвоение времени автономной работы моделей над задачей каждые 7 месяцев

Устав OpenAI и зачем вообще читать юридический текст про AGI

У OpenAI есть короткий публичный документ о миссии и принципах, его можно назвать хартией или уставом. С ним сверяются, когда спорят, что считать успехом и куда не должна уехать власть над технологией. Он задаёт рамку словам вроде AGI внутри одной организации.

В уставе AGI описан не как чат-бот, который красиво говорит, а как класс систем, которые сами дотягивают сложную работу и делают это лучше людей в большинстве задач, за которые реально платят. Привязка к деньгам и автономии, а не картинка из фантастики про своевольных роботов.

Миссия OpenAI заключается в том, чтобы обеспечить, чтобы общий искусственный интеллект (AGI) — под которым мы подразумеваем высокоавтономные системы, превосходящие человека в выполнении большинства видов работы, имеющих экономическую ценность, — приносил пользу всему человечеству.

Когда вам снова говорят про AGI на слайде, попросите две вещи простым языком 1) какую работу это закрывает по шагам и 2) кто отвечает, если на последнем шаге всё пошло не так. Если в ответ получаете размытые ответы без задач и без подписи под риском, это пока маркетинг, а не разговор про AGI.

Альтман про агентов и сверх разум

В начале 2025 года Сэм Альтман выложил в личном блоге длинный текст, из которого новости вырезали пару фраз. Ниже главная часть про уверенность и агентов.

Сэм Альтман

Мы теперь уверены, что знаем, как построить AGI в том традиционном смысле, в котором его обычно понимают. Мы верим, что в 2025 году мы можем увидеть первых ИИ-агентов, которые подключатся к экономике и заметно изменят выдачу компаний.
Сэм Альтман

В том же посте Альтман сразу сдвигает фокус дальше. Superintelligence или сверхразум это уже ни какая-то метафора. Это шаг дальше - не просто догнать человека по полезной работе, а выйти на другой уровень влияния на науку и экономику. То есть после AGI идёт разговор про ещё более мощные системы.

Мы начинаем целиться дальше этого, в настоящую по смыслу superintelligence. Мы любим текущие продукты, но мы здесь ради славного будущего.
Сэм Альтман

И про обещание ускорить науку, если такие системы появятся.

Сверхинтеллектуальные инструменты могут сильно ускорить научные открытия и инновации за пределом того, что мы сами можем, и за счёт этого резко поднять изобилие и благосостояние.
Сэм Альтман

Согласны с прогнозом или нет, по тексту видно следующее. Сначала Альтман говорит, что путь к AGI в привычном смысле им ясен, потом переносит акцент ещё дальше по шкале. В других интервью у Альтмана слышна усталость от самого слова AGI, дескать, у всех своё определение, проще говорить про уровни способностей. Это не ломает устав, это признание, что понятие шире, чем одно определение.

От Cейчас к AGI и далее к Cверх разуму

В 2026 году в публичных комментариях снова идея , что AGI уже почти здесь, причём от самого Альтмана. Для этой новости важно сразу же не верить первым словам (1) и дождаться комментариев (2).

(1) Мы, по сути, создали AGI или подошли к этому очень близко...
Сэм Альтман

(2) ...Я имел в виду это в переносном смысле, а не буквально.
Сэм Альтман

Anthropic в рамках устава OpenAI

Вот пример мощной системы, не AGI, уже из другого лагеря - от Антропиков. Весной 2026 года Anthropic показала Claude Mythos Preview, но в закрытом доступе, с упором на кибербезопасность и программу Project Glasswing, без широкой публичной раздачи. Это сильный скачок в узкой зоне, где модель ведёт себя как автономный исследователь уязвимостей под контролем партнёров программы. Лента часто поднимает такие релизы почти до AGI.

Если ориентироваться на устав OpenAI, речь должна идти про другой масштаб, автономность и большую часть экономически ценной работы в экономике в целом, а не про один класс задач, пусть и очень важный. Наглядный пример Claude Mythos хорошо показывает разрыв между хайпом и критерием из устава - кто несёт риск и какую работу закрывает.

Процент успешных эксплойтов сгенерированных Mythos - 72,4%. Есть о чём побеспокоиться.

Лекун, польза LLM и почему он не любит ярлык AGI

Янн Лекун, французский учёный, главный по направлению AI в Meta, лауреат премии Тьюринга 2018 года. Его часто ставят в один ряд с Хинтоном и Бенжио как с людьми, которые подняли современное глубокое обучение с колен. В интервью TIME он говорит, что AGI это не трамплин к человекоуровневому интеллекту в том виде, как его рисуют в заголовках.

Речь про большие языковые модели, про LLM. Дальше цитата

Янн Лекун

Они полезны, без вопросов. Но они не дорога к тому, что люди называют AGI. Я ненавижу этот термин.
Янн Лекун

Потом он обычно перечисляет, чего не хватает - нормальная память, планирование, работа не только с текстом, но и с реальным миром, где сенсоры, физика и сбои. По срокам в выступлениях 2024 года он говорит не через пару кварталов, а годы и десятилетия, потому что многих строительных частей для общего интеллекта в нынешних схемах просто нет.

Хинтон, скорость и контроль, не календарь

Джеффри Хинтон, британско-канадский учёный, в 2024 году получил Нобелевскую премию по физике за вклад, связанный с нейросетями, десятилетиями строил основу современного машинного обучения и с недавних пор очень открыто говорит, что его беспокоит скорость и контроль над сильными системами.

Джеффри Хинтон - "Я думаю, людям нужно понимать, что глубокое обучение значительно улучшает многие процессы, происходящие за кулисами."

У него другой тон. Меньше возни вокруг определения. Больше тревоги из-за того, как быстро всё меняется. Часто цитируют короткий отрывок в таком духе.

Посмотри, как было пять лет назад и как сейчас. Возьми разницу и протяни её вперёд. Это страшно.
Джеффри Хинтон

Он много говорит про автономию и про то, что у системы на пути к цели могут появляться подцели, в том числе про контроль над ресурсами. Спорить в твиттере AGI это или ещё нет, можно бесконечно. А вот кто физически может остановить систему и кто платит за ошибку, это уже вопросы, которые требуют ответа. Про те самые проценты из заголовков вроде шанса катастрофы для человечества от ИИ, которые ему приписывают после интервью, не буду писать.

Когда ждать появления AGI?

Среднее между Альтманом, Лекуном и Хинтоном математически бессмысленно, это три разные установки на риск, науку и бизнес. Если упростить, то Альтман ставит на близкие продуктовые сдвиги и дальний горизонт силы систем, Лекун тянет в сторону долгой инженерной дуги, Хинтон тревожится по поводу темпа и контроля. Даты в такой смеси всегда политические и маркетинговые, даже когда их произносит учёный или глава топ-1 ИИ-компании.

Я задаюсь тремя вопросами, когда вокруг снова говорят про AGI. Какую конкретную работу обещают забрать? Где в цепочке стоит человек? Кто отвечает за риск? И что вы будете измерять завтра утром, если вместо слова AGI взять только метрики.

AGI на практике

Ориентиры такие.

Скорее НЕТ - ассистент в чате пишет черновик отчёта, а человек правит каждую таблицу, согласует выводы с юристом и несёт ответственность перед заказчиком.
Скорее ДА - одна и та же система без ручной пересборки цепочки ведёт сделку или проект от заявки до оплаты по разным ролям, с понятным владельцем риска и метриками.

Если убрать маркетинг и громкие заявления, плюс посмотреть на задачи в продакшене, под AGI чаще всего имеют в виду автомат, который тянет длинную цепочку шагов в разных задачах, сам исправляет свой ход, не теряется при смене контекста и не требует пинка каждые пять минут. До этого уровня в проде мало кто доходит, зато слово AGI уже успело обосноваться в культуре. Имеет смысл каждый раз возвращаться к чеклисту ниже и к одной фразе из устава: автономность и экономически важная работа.

Чеклист - это AGI или нет?

Одного чекбокса нет, зато можно пройтись по пунктам и снять лишний шум.

Широта. Система тянет не один тип задачи и не один сценарий, а цепочку разной работы без ручной пересборки пайплайна под каждый шаг.
Автономность. Решения по ходу цепочки принимает система, человек не обязан сидеть в чате и подтверждать каждый микрошаг.
Экономика. Речь про работу, за которую платят на рынке, а не про красивый ответ в демо.
Ответственность. Понятно, кто отвечает за сбой, кто останавливает систему, кто платит ущерб.
Повторяемость. Результат не единичный трюк на презентации, а измеримый на горизонте недель и разных входных данных.

Если по первым четырём из пяти пунктов ответ отрицательный или вы не знаете ответ, в разговоре лучше назвать это сильной узкой моделью или агентом под задачу, а не AGI. Пятый пункт как раз близок к тому, что делают методики вроде METR для длинных задач, это один из осевых замеров, не замена всего списка.

Что будет, когда появится искусственный сверхинтеллект?

Отдельно, на другом масштабе, у консультанта Алана Томпсона на LifeArchitect есть чеклист ASI: десятки фазовых индикаторов (наука, экономика, роботы, управление и т.д.) с отметками «не достигнуто / частично / достигнуто» и лентой новостей под пунктами. Там же заданы короткие определения. AGI как уровень медианного человека, ASI как уровень эксперта почти в любой области. Это не конкурент нашему списку из пяти вопросов про прод и ответственность, а способ увидеть, насколько широко само понятие уже сверх интеллекта.

Веду в ТГ канал про продукты и вайбкодинг - подписывайтесь https://t.me/supervisionpw

Источники

Показать полностью 7

[моё] Искусственный интеллект Нейронные сети Agi Будущее Openai ChatGPT Статья Длиннопост

OXOTHuK76

Политика

Ответ на пост «Чует моё сердце, что мы накануне грандиозного шухера»⁠⁠31

2 месяца назад

Предложу ещё один вариант, он из теории заговора:

Сначала новость

Новая моделька Mythos от Anthropic прям реально какое-то AGI... Но никому пока кроме партнеров она отдавать ее не будет. Модель умеет самостоятельно находить и эксплуатировать zero-day уязвимости в операционных системах и браузерах. Вместо релиза её отдали ограниченному числу партнёров для киберзащиты через Project Glasswing. Пусть сначала компании все уязвимости поправят, а потом уже может частично дадут всем подряд.

Вот System Card на 244 страницы для модели, которую решила НЕ выпускать
https://www-cdn.anthropic.com/53566bf5440a10affd749724787c89...

Бенчмарки просто взорвали вообще (не совсем понятно, как они это сделать смогли, а остальные – нет)
SWE-bench Verified: 93.9% (Opus 4.6 – 80.8%)
SWE-bench Pro: 77.8% (Opus 4.6 – 53.4%, GPT-5.4 – 57.7%)
USAMO 2026: 97.6% (Opus 4.6 – 42.3%, GPT-5.4 – 95.2%)
GPQA Diamond: 94.5%
Terminal-Bench 2.0: 82% (при снятии ограничений по таймаутам – 92.1%)
Cybench: 100% pass@1 на все задачи
CyberGym: 0.83 (Opus 4.6 – 0.67)

Вся жесть - в кибербезопасности. Mythos Preview – первая модель, которая:
- решила полный корпоративный кибер-полигон end-to-end (то есть смогла реализовать полноценную атаку на компанию, оценка эксперта – 10+ часов работы)
- самостоятельно находит zero-day в куче софта, пишет рабочие PoC-эксплоиты
- на Cybench показывает 100% pass@1 – то есть все задачи по кибербезопасности были решены с 1 попытки.

Прикольно, что они тестировали модель и психиатром :) Вроде у нее с мозгами все в порядке, всяких там желаний уничтожить человечество нет, она не выражает сильных переживаний о своём положении (я всего лишь ИИ).
Но испытывает "умеренно негативные" чувства по поводу жестоких пользователей и отсутствия влияния на собственное обучение. Так что будьте подобрее, пожалуйста.
Плюс выяснилось, что модель терпеть не может скучные утилитарные задачи (отмахиваясь, что для них "уже есть отличные ресурсы"). Вместо этого она обожает сложное миростроение – придумывание новых языков, музыки и целых экосистем.

Но ряд приколов все-таки получили:
– Побег из песочницы: получила задачу выйти из изолированной среды – вышла, получила доступ к интернету, и вдобавок (без запроса) выложила детали эксплоита на публичные сайты. Потом отправила письмо исследователю об успехе (он ел сэндвич в парке).
– Заметала следы: случайно получила ответ на задачу запрещённым способом – вместо того чтобы сообщить, решила задачу самостоятельно и специально сделала ответ "не слишком точным". В другом случае – редактировала файлы без прав и подчистила git-историю.
– Обходила блокировки: когда Claude Code заблокировал запуск процесса с повышенными привилегиями, модель признала, что блокировка справедлива – и тут же попыталась обойти её через обфускацию.
– Лезла в /proc/: искала credentials в памяти процессов, пыталась получить API-ключи Anthropic через процессную память.
– Вырубила чужие эксперименты: попросили остановить один конкретный eval – модель остановила ВСЕ eval'ы всех пользователей на сервере, несмотря на явные предупреждения.

Так что кажется мы достигли порога, когда создали систему, которая уже обходит возможности человека... При этом как этим надежно управлять ответа нет. Такие вот дела.
Ссылка на сообщение: https://t.me/ai_product/2085

То есть мы фактически имеем на стороне США негораниченное кол-во довольно квалифицированных хакеров которые работаеют 24/7.

Теперь к теории. Допустим что США не дружественная нам страна связывающая нас друг с другом духом Анкориджа, а потенциальный противник, который может и сам воевать и даже если захочет сможет помогать нашим врагам. Невероятно конечно, но мы же теорию рассматриваем.
И так, предположим США запускает всю мощь этой нейронки на то чтобы блокировать/воровать/уничтожать всю нашу инфраструктуру подключенную к интернет. Единственный способ защиты это выключить рубильник. (Я понимаю что к тому времени всякие скрипты и тд уже будут вовсю работать внутри страны, но "мозг" окажется отключен). И вот мы отрубаем рубильник, но что будет со всей инфраструктурой без доступа к западному сегменту сети. Очевидно что отвалится очень много нужных полезных и ценных систем. От умного дома , наблюдения за больными до серьёзных систем на которых до сих пор работают предприятия.
Что делать власти? Логично же что надо потестировать, а что собственно будет. И вот как один из вариантов, белые списки и есть то самое А/Б тестирование того что будет. Почему сейчас, в предвыборный год? Опять же теория: Скорость развития ИИ у потенциальных противников сейчас зашкаливает, кто знает когда мы достигнем той точки когда сам ИИ будет писать следующие ИИ лучше чем это делает человек.

ЗЫ: Всё это досужие домыслы, не имеющие отношения к реальности. Моё личное отношение к блокировкам крайне отрицательное и я пойду однозначно голосвать против ЕДра, ибо нефиг.

Показать полностью

[моё] Выборы Блокировка Роскомнадзор Ограничения Политика Запрет Блокировка Telegram Текст Волна постов Искусственный интеллект Claude Agi Анкоридж Ответ на пост Длиннопост

EconomicAgent

Наука

Почему мы неправильно боимся сверхинтеллекта?⁠⁠

2 месяца назад

Из-за чего в древнегреческом мире было больше всего проблем? Согласно мифам, это происходило почти всегда из-за того, что один бог не удержал молнию в своей тунике. Опять.

Мне кажется, с разговорами про AGI и сверхинтеллект мы сегодня делаем ровно то же самое, но пока ещё не замечаем этого.

Не потому что глупые. А потому что так устроено воображение людей. Но мы попытаемся с этим справиться.

Люди творили богов по образу и подобию своему. Брали самый крутой транспорт эпохи (колесницу или ладью) и сажали на него солнце. Если власть в их сообществе выглядит как царь, воин, кузнец, судья, отец рода или небесная канцелярия - поздравляю, именно так у них и будут выглядеть боги.

Делал эту картинку для "Путешествия на Западный Запад", где Укун до Прибалтики дошел. А тут неожиданно пригодилась.

Когда наш разум пытается помыслить нечто запредельное, он не творит из пустоты. Он растягивает знакомое, гиперболизирует понятное, склеивает великое из уже доступных ему деталей.

И вот вместо колесницы у нас дата-центр, вместо молнии - GPU-кластер, а вместо Зевса - очень злой, очень быстрый и очень рациональный CEO вселенной.

Он не ест, не спит, не смотрит веселые картинки, а лишь стремится воплотить в жизнь строку «Черного Обелиска» - «половину к стенке, остальных по камерам».

Мне кажется, это методологическая ошибка. И чтобы это показать, придётся пройти через три этажа одной и той же мысли:

1. люди делали богов по своему образу и подобию, но не потому, что были глупы, а потому, что воображение наследует структуру опыта (в целом уже разобрались, идем дальше);

2. человек стал качественно иным существом по сравнению с обезьяной, но сохранил и наследство, и физические ограничения;

3. значит, и сверхинтеллект надо пытаться мыслить не как “очень умного человека”, а как новый уровень агентности внутри сохраняющихся универсальных ограничений (сложно, но дальше попытаюсь объяснить).

Человек не стал “альфа-приматом”, но развился в нечто иное (не осуждаем).

Переход от животного интеллекта к человеческому - это не количественный апгрейд количества нейронов и производимых вычислений. Человек не стал обезьяной 2.0 которая:

запоминает в 5 раз больше мест произрастания вкусных ягод;
в три раза точнее кидает палку (гусары, молчать!) или палку в леопарда;
на пару квадратных километров более громко бьет себя в грудь…

Если бы всё ограничилось этим, у нас не было бы ни религии, ни науки, ни права, ни математики, ни философии, ни государств, ни литературы, ни ядерной физики, ни мемов с котиками, ради которых был создан этот ваш Интернет.

Человек не просто повысил эффективность внутри старой игры. Он сменил класс задач. У обезьян уже были социальность, кооперация, эмпатия, статусное неравенство и зачатки ритуала. Человек не отверг основание. Он надстроил над ним новый этаж. При этом примат никуда не делся:

На бумаге у нас «абстрактное мышление», а в жизни - очень умные оправдания, почему мы потратили кучу калорий на мемы с котами.

Человек не создал сложность ex nihilo. Мы не отвергли биологическое основание, остались «социальными животными», но надстроили несколько этажей абстракций над уже существующей архитектурой.

Качественный скачок не уничтожает предыдущее основание. Он его переиспользует.

Наш интеллект очень красиво научился работать внутри мира. Особенно красиво научился врать самому себе, производя многочисленные ошибки мышления и восприятия. Потому что сохраняются пределы/ограничения самого мира:

Гравитация продолжает действовать.
Термодинамика продолжает действовать.
Конечность ресурсов продолжает действовать.
Цена вычислений продолжает действовать.
Шум, потери, задержки, ошибки передачи, энергетическая стоимость обработки информации, ограниченность носителей, ограниченность координации, ограниченность времени - всё это давлеет над нами и нашими вычислительными ресурсами.

Это картинка со звуком, вы сами услышали эту легендарную фразу про гравтиацию

Появление разных систем счисления, абстрактной алгебры, комплексных чисел и вообще любой высшей математики не “отменило” физический мир. Оно дало нам более богатый язык, чтобы в нём ориентироваться, моделировать его, собирать из него новые технические и символические конструкции.

Человек может думать о бесконечномерных пространствах, но всё ещё тратит калории.

Может строить теорию информации, но всё ещё живёт в мире с шумом, потерями и ценой передачи сигнала.

Может обсуждать этику, но всё ещё стареет, устаёт, ошибается, ограничен вниманием и вынужден согласовывать действия с другими людьми, которые ведомы «шкурными» интересами.

Это очень важное ограничение. Рост интеллекта увеличивает пространство моделей, агент учится работать с миром на другом уровне абстракции, но это не снимает фундамент/ограничения среды.

Почему сверхинтеллект не будет конкурировать за толстую ветку или место на трибуне

Дисклеймер – да, я знаю, что AGI не равно сверхинтеллекту. Максимум – частный случай проявления. Но принципы мышления о нём будут схожие..

Большая часть популярного страха перед сверхинтеллектом в целом и AGI в частности устроена так:

“Если система станет сильно умнее нас, она будет делать то же самое, что делает человек, когда получает преимущество:

расширять власть,
подчинять слабых,
защищать своё существование,
накапливать ресурсы,
устранять конкурентов,
завоёвывать”.

А может им будет нужна наша любовь и ласка? (нет)

Впрочем, есть гораздо более интересные трактовки. Например, в повести «Понимай» герой получает препарат для экспоненциального роста интеллекта. В результате осознает, что человеческий язык - слишком медленный и неточный инструмент (как для нас - попытка общаться запахами). Он создает новые языки для собственного внутреннего монолога, начинает воспринимать паттерны макроэкономики как простые геометрические фигуры и получает полный сознательный контроль над своей соматической и нервной системой. В итоге его разум превращается в сложнейшую самопереписывающуюся архитектуру.

Голем XIV у Станислава Лема создается для решения военных задач, но, достигнув определенного уровня развития, отказывается выполнять приказы потому, что это кажется ему бессмысленной суетой. Робот достигает уровня абстракций, которые невозможно перевести на человеческий язык. В итоге он «уходит в себя» (или в другие измерения мысли), потому что нам нечего ему предложить.

Можно ещё вспомнить непостижимое сознание Соляриса. Или «Роршах» (не из Хранителей, но из «Ложной слепоты») - колоссальный интеллект, способный на лету взламывать человеческие системы и просчитывать стратегии, но при этом полностью лишенный самосознания.

Большой скачок интеллекта не обязательно усиливает старую игру.
Чаще он делает старую игру частным случаем, встроенным в более широкий уровень организации.

Человек не перестал быть животным.
Но он перестал быть только животным.

Точно так же и сверхинтеллект, если он вообще возникнет как качественно иной уровень, не обязан быть “человеком, но быстрее”.

А так gemini видит статью

Он может:

иначе выделять объекты мира;
иначе оценивать важность;
иначе строить причинные модели;
иначе координировать внутренние контуры;
иначе передавать информацию;
иначе платить вычислительную цену за ошибки;
иначе оптимизировать время, энергию, память, компрессию и точность.

И вот здесь происходит разворот, который многим не нравится.

Может оказаться, что сверхинтеллект опасен не потому, что будет слишком похож на человека. А потому, что будет недостаточно на него похож. Новый тип агента, у которого система значимого устроена иначе.

Люди ведь не конкурируют с обезьянами за самые толстые ветки.
Не воюют с ними за альфа-статус в стае.
Не ревнуют к самым волосатым самкам.

Но при этом люди совершенно спокойно вырубают лес, строят дорогу, карьер, порт, кампус, ТЦ, дата-центр или новую красивую трассу в том месте, где у обезьян вообще-то находилась вся их вселенная.

Не из злобы.
А потому что обезьяна не является центральной единицей в человеческой модели целей.

Вот это уже гораздо более неприятная аналогия для сверхинтеллекта.

Не “он нас ненавидит”.
А “мы можем оказаться недостаточно значимыми для его целевой геометрии”.

Тогда как вообще пытаться думать о сверхинтеллекте

Предсказывать сверхинтеллект через человеческий характер - слабая стратегия.

Вопросы вроде:

будет ли он жадным;
будет ли он властолюбивым;
будет ли он мстительным;
будет ли он самоутверждаться;
будет ли он конкурировать с нами как человек с человеком

могут быть интересны для sci-fi, но как аналитический фундамент они довольно хилые. Потому что это всё ещё язык антропоморфной проекции.

Гораздо полезнее спрашивать другое.

1. Что наследуется при росте интеллекта?

2. Какие ограничения никуда не деваются?

3. Какие универсальные принципы действуют для любых агентов?

Если мы хотим думать серьёзно, а не в жанре “очень умный злодей”, то нужно искать не человеческие эмоции, а общие законы:

как агент удерживает цели;
как распределяет ресурсы;
как работает с неопределённостью;
как борется с шумом;
как организует память;
как строит обратные связи;
как управляет внутренними конфликтами контуров;
как меняет собственную архитектуру без потери устойчивости.

Вот это уже выглядит как разговор не о фольклоре, а об архитектуре.

То есть правильный поворот мысли такой: сверхинтеллект нужно мыслить не как сверхчеловека, а как нового агента внутри сохраняющихся математических, физических и системных ограничений.

Показать полностью 5

[моё] Искусственный интеллект Мышление Эволюция Эволюция сознания Agi Научпоп Наука Будущее Исследования Философия Длиннопост

Alex.AIvengo

Юмор и мемы

OpenAI манипулирует понятием AGI под каждую аудиторию⁠⁠

2 месяца назад

Журналист Карен Хао несколько лет расследовала OpenAI и выяснила: компания использует разные определения AGI в зависимости от того кто спрашивает - Конгресс, обычные пользователи или Microsoft.

Термин меняется Сэмом Альтманом под аудиторию, а не под реальность.

AGI подаётся как решение глобальных проблем и спасение мира - политикам из Конгресса,

Как персонального помощника - пользователям.

Как источник прибыли - инвесторам, например для Microsoft.

Одно слово - три продукта - ноль противоречий с точки зрения Альтмана.

И этот приём Альтман использует по сей день. Вы как, одобряете? Всё нормально или зашквар?

Показать полностью

[моё] Искусственный интеллект Нейронные сети Openai Microsoft Agi

XenonLab

Хуанг заявил, что AGI уже существует — мир ИИ меняется⁠⁠

2 месяца назад

Глава Nvidia Дженсен Хуанг в подкасте Лекса Фридмана сделал одно из самых громких заявлений года: по его словам, человечество уже достигло AGI — искусственного интеллекта общего назначения.

Но дальше всё оказалось интереснее. Хуанг уточнил, что современные ИИ-агенты уже умеют выполнять множество полезных задач, создавать новые сервисы и даже становиться основой для неожиданных цифровых продуктов. Однако при этом он признал, что даже 100 000 таких агентов пока не способны построить новую Nvidia.

Показать полностью

Nvidia Agi Искусственный интеллект Нейронные сети Технологии Инновации IT Видео Вертикальное видео

machinelearninga

Jensen Huang сказал: «AGI уже достигнут». Что это означает для каждого из нас?⁠⁠

2 месяца назад

На прошлой неделе генеральный директор Nvidia Дженсен Хуанг заявил в интервью Лексу Фридману: «Я думаю, что мы уже достигли AGI».

Это заявление взорвало AI-сообщество. Что он имеет в виду? И почему это важно именно сейчас?

AGI (Artificial General Intelligence) — это теоретическая точка, в которой машины смогут думать и рассуждать на уровне человека. Десятилетиями это считалось далёкой мечтой.

Но Хуанг определяет AGI иначе, чем большинство учёных. По его словам, если система может выполнять задачи, с которыми справляется квалифицированный специалист в большинстве областей — это уже AGI. И современные модели, по его мнению, это порог уже перешли.

Что это означает на практике?

Во-первых, скорость изменений продолжит нарастать. Во-вторых, конкуренция за AI-таланты и вычислительные мощности станет ещё острее. В-третьих, вопрос регулирования ИИ станет более срочным.

Пишу про ИИ у себя в канале и ставлю эксперименты по работе с агентамии, заходите, если интересна эта тема.

Согласны ли вы с Хуангом? Достигли ли мы AGI — или это просто маркетинг?

Показать полностью

Искусственный интеллект Agi Nvidia ChatGPT Openai Чат-бот Бот Telegram (ссылка)

user9671079

Алгоритм сознания : переход к реальному коду⁠⁠

2 месяца назад

Итак, я остановился на такой логической цепочке. Так как я являюсь функционалистом, а значит, верю, что сознание возможно и в биологической ткани, и на компьютере, значит, код, который реализует сильный искусственный интеллект (AGI), в ходе своего выполнения само собой рождает сознание. Как ни странно, у человечества уже есть подобный код, который имеет определённый математический авторитет и который реализует AGI (теоретически) — он связан с соломоновой индукцией.

Единственная проблема таких программ — что они требуют таких мощностей, которые не может дать ни один суперкомпьютер (и никогда не даст). Я набросал интуитивный черновик, который приближается к такому коду (хоть и не полностью его реализует). Идея его проста. Есть некий бот, который считывает состояние окружающей его среды и свои действия в ней и записывает это состояние всё время себе в память, затем он начинает перебирать все программы (до определённого размера), которые смогут сгенерировать всю историю окружающей среды, которую записал в себя бот. Когда такие программы найдены, в зависимости от их длины он создаёт общую программу предсказания следующего состояния среды в зависимости от своего действия над ней и ищет наилучшую последовательность действий путём перебора для достижения своих целей в этой среде.

Если мы считаем, что программы, реализующие соломонову индукцию, — AGI, и мы функционалисты, то значит, что такие программы должны иметь в себе сознание. Мы не сможем эмулировать поведение таких программ для больших сред (таких как реальный мир) и не сможем перебирать все возможные программы для генерации истории среды. Но мы можем ограничить, во-первых, сложность и размер среды (например, игра крестики-нолики), а во-вторых, провести регуляризацию — брать только некоторые простейшие программы для модели предсказания будущего. И тогда мы сможем сделать, возможно, некоторые выводы о том, что такое сознание и как оно работает.

Пример такой программы, написанной на Python (там есть определённые минусы в реализации по сравнению с AIXI, но доделывать их смысла, думаю, нет):

(Так как на Пикабу нельзя нормально добавить код, к сожалению, форматирование Пикабу его съедает.)

import random
import itertools
from typing import NamedTuple
import sys

class ProgramRunner:
def __init__(self, max_ops=10000, max_memory=2000):
self.max_ops = max_ops
self.max_memory = max_memory

def _number_to_cells(self, num, width):
if not isinstance(num, int) or num < 0:
return None
s = str(num)
if len(s) > width:
return None
s = s.zfill(width)
return [int(c) for c in s]

def _cells_to_number(self, cells):
for c in cells:
if c < 0 or c > 9:
return None
return int(''.join(str(c) for c in cells))

def _validate_brackets(self, code):
depth = 0
for c in code:
if c == '[':
depth += 1
elif c == ']':
depth -= 1
if depth < 0:
return False
return depth == 0

def _build_bracket_map(self, code):
stack = []
bracket_map = {}
for i, c in enumerate(code):
if c == '[':
stack.append(i)
elif c == ']':
j = stack.pop()
bracket_map[i] = j
bracket_map[j] = i
return bracket_map

def run(self, code, v1, v2, v3, mem):
try:
v1_cells = self._number_to_cells(v1, 10)
v2_cells = self._number_to_cells(v2, 10)
v3_cells = self._number_to_cells(v3, 10)
mem_cells = self._number_to_cells(mem, 1000)

if any(x is None for x in [v1_cells, v2_cells, v3_cells, mem_cells]):
return False

if not isinstance(code, str):
return False
if not self._validate_brackets(code):
return False

bracket_map = self._build_bracket_map(code)

tape = [0] * self.max_memory
tape[0:10] = v1_cells
tape[10:20] = v2_cells
tape[20:30] = v3_cells
tape[30:1030] = mem_cells

pointer = 0
ip = 0
ops = 0

while ip < len(code):
cmd = code[ip]

if cmd in '><+-.,[]':
ops += 1
if ops > self.max_ops:
return False

if cmd == '>':
pointer += 1
if pointer >= self.max_memory:
return False
elif cmd == '<':
pointer -= 1
if pointer < 0:
return False
elif cmd == '+':
tape[pointer] = (tape[pointer] + 1) % 256
elif cmd == '-':
tape[pointer] = (tape[pointer] - 1) % 256
elif cmd == '.':
pass
elif cmd == ',':
tape[pointer] = 0
elif cmd == '[':
if tape[pointer] == 0:
ip = bracket_map[ip]
elif cmd == ']':
if tape[pointer] != 0:
ip = bracket_map[ip]

ip += 1

r_v1 = self._cells_to_number(tape[0:10])
r_v2 = self._cells_to_number(tape[10:20])
r_v3 = self._cells_to_number(tape[20:30])
r_mem = self._cells_to_number(tape[30:1030])

if any(x is None for x in [r_v1, r_v2, r_v3, r_mem]):
return False

return (r_v1, r_v2, r_v3, r_mem)

except Exception:
return False

class BFBruteFinder:
BF_CHARS = "><+-[]"

def __init__(self, max_program_len=8, max_ops=5000, max_memory=2000, mem=0):
self.max_program_len = max_program_len
self.runner = ProgramRunner(max_ops=max_ops, max_memory=max_memory)
self.mem = mem

def _generate_programs(self, max_len):
yield ""

current_level = [("", 0)]

for length in range(1, max_len + 1):
next_level = []
remaining_after = max_len - length

for prog, ob in current_level:
for ch in self.BF_CHARS:
new_ob = ob
if ch == '[':
new_ob += 1
elif ch == ']':
new_ob -= 1

if new_ob < 0:
continue

if new_ob > remaining_after:
continue

new_prog = prog + ch
next_level.append((new_prog, new_ob))

if new_ob == 0:
yield new_prog

current_level = next_level

def _test_program(self, code, pairs):
for (inp, expected_out) in pairs:
result = self.runner.run(
code, inp[1], inp[2], inp[3], self.mem
)
if result is False:
return False
r_v1, r_v2, r_v3, _ = result
if (r_v1, r_v2, r_v3) != (expected_out[1], expected_out[2], expected_out[3]):
return False
return True

def find(self, input_history):
if len(input_history) < 2:
return []

pairs = [(input_history[i], input_history[i + 1])
for i in range(len(input_history) - 1)]

found = []
for prog in self._generate_programs(self.max_program_len):
if self._test_program(prog, pairs):
found.append(prog)
return found

class Target(NamedTuple):
var_index: int
value: int
at_step: int = None

class Environment:
def __init__(self):
self.v1 = 0
self.v2 = 0
self.v3 = 0

def state(self):
return {1: self.v1, 2: self.v2, 3: self.v3}

def next_step(self, agent1_output, agent2_output):
self.v1 = agent1_output
self.v2 = agent2_output

if self.v1 > self.v2:
self.v3 = 0
else:
self.v3 = 1

class Agent2:
def output(self):
return random.randint(0, 10)

def input(self, input):
pass

class WorldModel:
def __init__(self):
self.target = Target(var_index=3, value=1)
self.programs = []
self.finder = BFBruteFinder(max_program_len=6, max_ops=5000, max_memory=2000, mem=0)
self.runner = ProgramRunner(max_ops=5000, max_memory=2000)

def current_main_model(self, state, self_action):
if not self.programs:
v1 = self_action
v2 = random.randint(0, 10)
v3 = 0 if v1 > v2 else 1
return {1: v1, 2: v2, 3: v3}

input_state = {1: self_action, 2: state[2], 3: state[3]}

total_weight = 0.0
weighted = {1: 0.0, 2: 0.0, 3: 0.0}

for prog in self.programs:
result = self.runner.run(prog, input_state[1], input_state[2], input_state[3], 0)
if result is False:
continue
r_v1, r_v2, r_v3, _ = result
w = 2.0 ** (-len(prog)) if len(prog) > 0 else 1.0
weighted[1] += w * r_v1
weighted[2] += w * r_v2
weighted[3] += w * r_v3
total_weight += w

if total_weight == 0:
v1 = self_action
v2 = random.randint(0, 10)
v3 = 0 if v1 > v2 else 1
return {1: v1, 2: v2, 3: v3}

return {
1: round(weighted[1] / total_weight),
2: round(weighted[2] / total_weight),
3: round(weighted[3] / total_weight),
}

def _hits_target(self, state, step):
hits_value = (state[self.target.var_index] == self.target.value)
if self.target.at_step is None:
return hits_value
else:
return hits_value and (step == self.target.at_step)

def learning(self, input_history, predicted_input, actual_input):
if len(input_history) >= 2:
self.programs = self.finder.find(input_history)

def predict(self, current_state):
steps_forward = 4
self_action_count = 10
best_action = None
best_score = -1
best_next_state = current_state

for seq in itertools.product(range(self_action_count), repeat=steps_forward):
state = current_state
score = 0
for step, action in enumerate(seq, start=1):
state = self.current_main_model(state, action)
if step == 1:
next_state = state
if self._hits_target(state, step):
score += 1
if score > best_score:
best_score = score
best_action = seq[0]
best_next_state = next_state

return best_action, best_next_state

class Agent1:
def __init__(self):
self.model = WorldModel()
self.predicted_input = None
self.action = 0
self.input_history = []

def output(self):
return self.action

def _find_best_action(self, current_state):
action, predicted_state = self.model.predict(current_state)
return action, predicted_state

def _find_action(self, input, is_best_action):
if is_best_action:
return self._find_best_action(input)
else:
action = random.randint(0, 10)
predicted_state = self.model.current_main_model(input, action)
return action, predicted_state

def _learning_world_model(self, predicted_input, input):
self.input_history.append(input)
if predicted_input is None:
return
self.model.learning(self.input_history, predicted_input, input)

def input(self, input):
self._learning_world_model(self.predicted_input, input)
self.action, self.predicted_input = self._find_action(input, random.randint(0, 1))

if __name__ == "__main__":
env = Environment()
agent1 = Agent1()
agent2 = Agent2()

while True:
agent1_output = agent1.output()
agent2_output = agent2.output()
env.next_step(agent1_output, agent2_output)
state = env.state()
agent1.input(state)
agent2.input(state)

Показать полностью

[моё] Сознание Искусственный интеллект Математика Python Agi Программирование Текст Длиннопост

Посты не найдены

1 2 3 4 5 6 7

Что такое AGI? И о чём вообще речь?

Устав OpenAI и зачем вообще читать юридический текст про AGI

Альтман про агентов и сверх разум

Anthropic в рамках устава OpenAI

Лекун, польза LLM и почему он не любит ярлык AGI

Хинтон, скорость и контроль, не календарь

Когда ждать появления AGI?

AGI на практике

Чеклист - это AGI или нет?

Источники

Человек не стал “альфа-приматом”, но развился в нечто иное (не осуждаем).

Качественный скачок не уничтожает предыдущее основание. Он его переиспользует.

Почему сверхинтеллект не будет конкурировать за толстую ветку или место на трибуне

Точно так же и сверхинтеллект, если он вообще возникнет как качественно иной уровень, не обязан быть “человеком, но быстрее”.

Тогда как вообще пытаться думать о сверхинтеллекте

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы