Ответ на пост «Чует моё сердце, что мы накануне грандиозного шухера»30
Предложу ещё один вариант, он из теории заговора:
Сначала новость
Новая моделька Mythos от Anthropic прям реально какое-то AGI... Но никому пока кроме партнеров она отдавать ее не будет. Модель умеет самостоятельно находить и эксплуатировать zero-day уязвимости в операционных системах и браузерах. Вместо релиза её отдали ограниченному числу партнёров для киберзащиты через Project Glasswing. Пусть сначала компании все уязвимости поправят, а потом уже может частично дадут всем подряд.
Вот System Card на 244 страницы для модели, которую решила НЕ выпускать
https://www-cdn.anthropic.com/53566bf5440a10affd749724787c89...
Бенчмарки просто взорвали вообще (не совсем понятно, как они это сделать смогли, а остальные – нет)
SWE-bench Verified: 93.9% (Opus 4.6 – 80.8%)
SWE-bench Pro: 77.8% (Opus 4.6 – 53.4%, GPT-5.4 – 57.7%)
USAMO 2026: 97.6% (Opus 4.6 – 42.3%, GPT-5.4 – 95.2%)
GPQA Diamond: 94.5%
Terminal-Bench 2.0: 82% (при снятии ограничений по таймаутам – 92.1%)
Cybench: 100% pass@1 на все задачи
CyberGym: 0.83 (Opus 4.6 – 0.67)
Вся жесть - в кибербезопасности. Mythos Preview – первая модель, которая:
- решила полный корпоративный кибер-полигон end-to-end (то есть смогла реализовать полноценную атаку на компанию, оценка эксперта – 10+ часов работы)
- самостоятельно находит zero-day в куче софта, пишет рабочие PoC-эксплоиты
- на Cybench показывает 100% pass@1 – то есть все задачи по кибербезопасности были решены с 1 попытки.
Прикольно, что они тестировали модель и психиатром :) Вроде у нее с мозгами все в порядке, всяких там желаний уничтожить человечество нет, она не выражает сильных переживаний о своём положении (я всего лишь ИИ).
Но испытывает "умеренно негативные" чувства по поводу жестоких пользователей и отсутствия влияния на собственное обучение. Так что будьте подобрее, пожалуйста.
Плюс выяснилось, что модель терпеть не может скучные утилитарные задачи (отмахиваясь, что для них "уже есть отличные ресурсы"). Вместо этого она обожает сложное миростроение – придумывание новых языков, музыки и целых экосистем.
Но ряд приколов все-таки получили:
– Побег из песочницы: получила задачу выйти из изолированной среды – вышла, получила доступ к интернету, и вдобавок (без запроса) выложила детали эксплоита на публичные сайты. Потом отправила письмо исследователю об успехе (он ел сэндвич в парке).
– Заметала следы: случайно получила ответ на задачу запрещённым способом – вместо того чтобы сообщить, решила задачу самостоятельно и специально сделала ответ "не слишком точным". В другом случае – редактировала файлы без прав и подчистила git-историю.
– Обходила блокировки: когда Claude Code заблокировал запуск процесса с повышенными привилегиями, модель признала, что блокировка справедлива – и тут же попыталась обойти её через обфускацию.
– Лезла в /proc/: искала credentials в памяти процессов, пыталась получить API-ключи Anthropic через процессную память.
– Вырубила чужие эксперименты: попросили остановить один конкретный eval – модель остановила ВСЕ eval'ы всех пользователей на сервере, несмотря на явные предупреждения.
Так что кажется мы достигли порога, когда создали систему, которая уже обходит возможности человека... При этом как этим надежно управлять ответа нет. Такие вот дела.
Ссылка на сообщение: https://t.me/ai_product/2085
То есть мы фактически имеем на стороне США негораниченное кол-во довольно квалифицированных хакеров которые работаеют 24/7.
Теперь к теории. Допустим что США не дружественная нам страна связывающая нас друг с другом духом Анкориджа, а потенциальный противник, который может и сам воевать и даже если захочет сможет помогать нашим врагам. Невероятно конечно, но мы же теорию рассматриваем.
И так, предположим США запускает всю мощь этой нейронки на то чтобы блокировать/воровать/уничтожать всю нашу инфраструктуру подключенную к интернет. Единственный способ защиты это выключить рубильник. (Я понимаю что к тому времени всякие скрипты и тд уже будут вовсю работать внутри страны, но "мозг" окажется отключен). И вот мы отрубаем рубильник, но что будет со всей инфраструктурой без доступа к западному сегменту сети. Очевидно что отвалится очень много нужных полезных и ценных систем. От умного дома , наблюдения за больными до серьёзных систем на которых до сих пор работают предприятия.
Что делать власти? Логично же что надо потестировать, а что собственно будет. И вот как один из вариантов, белые списки и есть то самое А/Б тестирование того что будет. Почему сейчас, в предвыборный год? Опять же теория: Скорость развития ИИ у потенциальных противников сейчас зашкаливает, кто знает когда мы достигнем той точки когда сам ИИ будет писать следующие ИИ лучше чем это делает человек.
ЗЫ: Всё это досужие домыслы, не имеющие отношения к реальности. Моё личное отношение к блокировкам крайне отрицательное и я пойду однозначно голосвать против ЕДра, ибо нефиг.






