Пока одни предрекают появление сверхразума (AGI) в ближайшие пару лет, а другие ждут восстания машин, один из главных людей в мире ИИ, научный руководитель Google DeepMind Джефф Дин, решил остудить пыл. В недавнем интервью он объяснил, почему разговоры о скором появлении AGI — это пустая трата времени.
Почему он избегает самого термина AGI?
По словам Дина, у термина "AGI" (сильный искусственный интеллект) нет четкого научного определения. Для одного это ИИ, который умнее среднего человека, для другого — сверхразум, превосходящий лучших экспертов во всех областях. Разница в сложности этих задач, как говорит Дин, может отличаться "в триллион раз". Поэтому он предпочитает говорить о конкретных достижениях, а не о туманных концепциях.
ИИ уже умнее среднего человека? Да, но есть нюанс.
Дин считает, что современные нейросети уже превосходят среднего человека в большинстве задач, не связанных с физическим миром. "Большинство людей не очень хороши в случайной задаче, которую они никогда не делали", — говорит он, отмечая, что ИИ с такими вещами справляется "довольно разумно".
Но это не делает его сверхинтеллектом. Дин подчеркивает, что ИИ все еще часто ошибается, не дотягивает до уровня настоящего эксперта во многих сферах и абсолютно беспомощен в задачах, требующих взаимодействия с реальным миром (например, он не научится водить машину за несколько десятков часов, как человек).
В чем главная проблема на пути к AGI?
По мнению руководства Google DeepMind, одна из ключевых преград — нестабильность и непоследовательность ИИ. Нейросеть может решить сложнейшую научную задачу, а в следующую минуту допустить глупую арифметическую ошибку, которую заметит и школьник. Эту проблему называют "рваным интеллектом" (jagged intelligence).
Вывод от одного из создателей современного ИИ прост: да, нейросети — невероятно мощный инструмент, который уже меняет мир. Но до создания настоящего мыслящего разума, способного стабильно и надежно работать на уровне эксперта во всех областях, еще очень далеко.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
В первую очередь передаю привет моим дорогим 89-ти подписчикам.
Вы читаете статью из проекта «Виртуальное Пермское метро».
Прошло почти 3 года с последнего поста про Пермский метрополитен.
Поэтому самое время напомнить, что здесь вообще происходит. В 2022 году мне пришла идея «построить» виртуальное метро в Перми, но технологии того времени не позволили мне далеко продвинуться в этом деле, зато 2025 год со своим развитием нейросетей дал мне такую возможность.
Для полноты картины предлагаю прочитать этот пост и этот.
Предупреждение: я не строитель и не архитектор. Я просто любитель метро. Все созданные мною изображения являются выдумкой и созданы для того, чтобы вы улыбнулись и помечтали (ну или взгрустнули).
Приступим!
В этот раз я решил перенестись в параллельную реальность и пофантазировать на тему «А что, если бы метро в Перми построили в 80-е и открыли в 90-е», как и планировалось.
Для этого я взял схему, которую проектировали в те времена:
Решил, что для начала буду «строить» красную линию, а синюю оставлю проектируемой. Так, скорей всего, и сделали бы в 80-е.
В итоге получилась вот такая линия, я ее слегка модернизировал и добавил станцию «Речной вокзал»:
По моим задумкам линию начали строить в начале 80-х, а открытие состоялось в 1990 году, поэтому и дизайн метро соответствующий (ну, почти).
Начнем с логотипа и схемы:
Куда же без жетона. Для полной картины был создан жетон образца 1990 года:
Начать «строительство» метрополитена я решил со станции «Заостровка».
Станция является западным терминалом линии. Местоположение выбрано не случайно: рядом находится жилой массив, который благодаря открытию станции получит огромный рывок в развитии, а также электродепо, обслуживающее всю линию. «Заостровка» должна стать удобной отправной точкой для пассажиров, ежедневно направляющихся в центр города и его восточную часть.
«Заостровка» является станцией мелкого заложения и выполнена в типичном для 80-х годов стиле советского метростроения:
Стены облицованы белым мрамором с серыми прожилками.
Пол выложен серым гранитом, подчёркивающим строгость композиции.
Навигационные элементы выполнены типичными для того времени элементами, а главным украшением станции стало мозаичное панно, расположенное в торце зала:
Немного красоты все-таки добавим и сделаем люстру на входной/выходной группе:
Постарался реализовать стиль надписи и навигации:
«Заостровка» является конечной станцией, о чем нам говорит данная надпись на другом пути:
Наземный павильон станции скромен по размеру, но выразителен.
Облицовка белым известняком, красный гранитный цоколь.
Широкие стеклянные двери ведут в подземный вестибюль.
На фасаде размещена красная буква «М» и название станции.
Вестибюль выходит прямо к жилым кварталам, создавая удобный доступ для жителей и работников депо.
«Заостровка» создаёт образ рабочей окраины: суровая, индустриальная, но при этом просторная и светлая. Она олицетворяет советский функционализм и отражает дух времени.
Первая станция Пермского метрополитена готова!
Осторожно, двери закрываются, следующая станция — «Парковый проспект».
❓ Небось начали читать заголовок, и подумали: "ИИ не тот, кем был прежде? Ну конечно тот! Иначе почему он уже не AGI и не способен на всё, что угодно?"
🫵 А что если я скажу вам, что ИИ уже действительно не тот, ведь он ЧЕЛОВЕК?
❓ Сразу появилась мысль: "Ничего себе как автор не разбирается в ИИ. Не может же быть он человеком, когда это просто статистическая сеть"
👉 Но ведь наш мозг - это тоже статистическая сеть нейронов (но правда с дополнительными более сложными механизмами, которыми пока что не обладают LLM)
☝️ Но даже без этих механизмов LLM уже способен вести себя так, будто бы он и вправду человек! (Настолько точно имитировать, что прямо человек-человек)
📈 Почти специально для сообщества Pikabu был проведён эксперимент: насколько человечным может быть ИИ для Discord сервера (дали ему доступ к чату и к инструментам управления сервером). И это вообще... Просто посмотрите:
Первый скрин демонстрации ИИ
☝️ Это уже не просто ответы ChatGPT вроде: "О, как приятно с тобой пообщаться! О, я не могу помочь с этой темой! О, ты оказался очень точным в своём вопросе!"
👉 Это прямиком общение, схожее с "прошаренным" человеком, который "в курсе своего дела"
👇 Ещё пример
Второй скрин демонстрации ИИ
☝️ А тут ещё интереснее! ИИ не просто слушается каждого попавшегося. Он пытается делать так, как сам считает нужным. Хотя, разумеется, это опасно с точки зрения безопасности, но интересно с зрения того, что ИИ поощряет свою волю реальными действиями. Так ещё и обратите внимание на то, КАК он отвечает! Как будто бы реальный человек!
👇 Следующий примерчик:
Третий скрин демонстрации ИИ
☝️ Опять же, ИИ не слушается каждого попавшегося (он знает, кто админы, а кто обычные участники) - это уже большой шаг в безопасности ИИ от манипулирования. Так ещё он ведёт себя так, будто он реальный админ, который просто сидит на вебхуке.
👇 Ещё скриншот:
Четвёртый скрин демонстрации ИИ
☝️ Очень, при очень хорошо! Вы просто вчитайтесь в его ответы: разве это похоже на ИИ? Можно даже предположить, будто бы это мы специально создали вебхук и сидели с него, писали. Хотя это не так
👉 Хоть это всё только малая часть того, что писал и что делал бот, но даже она - уже поражает!
❓ А теперь самый главный вопрос: а что это в итоге за модель ИИ?
👉 Попробуйте предположить в комментариях, ведь в следующих постах, скорее всего, эта тайна будет раскрыта. Готов также и к критике подхода: может быть стоит тестировать человечность ИИ какими-то ещё способами? Или может скриншоты ещё не до конца демонстрируют его возможности?
Я рассказала GPT про шутки, основанные на запросах про кружку без дна и правый и левый ботинок. Объяснила, что именно кажется людям смешным. И попросила придумать, какими бы могли быть шутки нейронок о людях, и почему эти шутки нейросетям покажутся смешными.
Подпишись на сообщество - тут пишем новости Искусственного интеллекта и как его использовать в работе https://pikabu.ru/community/aivibe
ChatGPT — Что делает: умный помощник — отвечает, пишет тексты, помогает с кодом. — Чем отличается от других: самый универсальный и «рассуждающий», много интеграций.
Gemini — Что делает: помощник Google — ищет, отвечает, рисует картинки. — Чем отличается от других: лучшая связка с YouTube/Drive/Docs и поиском Google.
DeepSeek — Что делает: бот для сложных задач и кода. — Чем отличается от других: сильные рассуждения при низкой цене/высокой скорости.
Grok — Что делает: чат-бот с данными из X/Twitter. — Чем отличается от других: берёт тренды прямо из X, дерзкий стиль.
character.ai — Что делает: чат с вымышленными персонажами. — Чем отличается от других: огромная библиотека ролей и сюжетов.
Perplexity — Что делает: поиск, который сразу даёт короткий ответ со ссылками. — Чем отличается от других: всегда показывает источники и Что делает веб-обзоры.
Claude — Что делает: помощник по тексту/коду и большим документам. — Чем отличается от других: очень длинный контекст и аккуратность ответов.
JanitorAI — Что делает: ролевые чаты-персонажи (в т.ч. 18+). — Чем отличается от других: фокус на ролевке/NSFW-сценариях.
Quark — Что делает: браузер с ИИ-ответами. — Чем отличается от других: ориентирован на Азию, много встроенных мини-инструментов.
Google AI Studio — Что делает: «песочница» для проб моделей Gemini. — Чем отличается от других: быстро тестить промпты и API без кода.
remove.bg — Что делает: убирает фон на фото в один клик. — Чем отличается от других: одна задача — максимально быстро и массово.
Doubao — Что делает: ассистент от ByteDance (TikTok). — Чем отличается от других: сильная китайская локаль и связки экосистемы ByteDance.
NotebookLM — Что делает: загружаешь файлы → конспект и ответы по ним. — Чем отличается от других: авто-конспекты, цитаты, дружит с Google Drive.
SPICYCHAT.AI — Что делает: ролевые чаты для взрослых. — Чем отличается от других: упор на персонализацию NSFW-персонажей.
Suno — Что делает: музыку и песни по описанию. — Чем отличается от других: «готовые треки из коробки» (вокал+минус).
QuillBot — Что делает: переписывает текст проще/лучше, чинит грамматику. — Чем отличается от других: режимы стиля и учебный фокус.
Kimi — Что делает: читает очень длинные документы и отвечает. — Чем отличается от других: сверхдлинное окно контекста.
PolyBuzz — Что делает: перевод, озвучка и субтитры для видео. — Чем отличается от других: весь пайплайн локализации «в одном месте».
SeaArt — Что делает: рисует картинки по тексту. — Чем отличается от других: много готовых стилей — удобно новичкам.
Qwen3 — Что делает: модели Alibaba и их чат-бот. — Чем отличается от других: сильные китайские задачи и enterprise-связки.
ElevenLabs — Что делает: реалистичные голоса из текста, клон-голоса. — Чем отличается от других: топ-качество синтеза/эмоций.
Hugging Face — Что делает: «магазин» моделей и датасетов; можно запускать онлайн. — Чем отличается от других: огромный открытый хаб + Spaces.
Lovable — Что делает: строит веб-приложение по вашему описанию. — Чем отличается от других: генерит целую структуру проекта, не только куски кода.
Crushon AI — Что делает: романтичные чат-компаньоны. — Чем отличается от других: визуальные аватары и «эмоциональность».
Gamma — Что делает: презентации и мини-сайты из текста. — Чем отличается от других: дизайнерский вид «как у профи».
Cursor — Что делает: редактор кода с ИИ-помощником. — Чем отличается от других: правки по диффам, глубокая работа с репозиториями.
Pixelcut — Что делает: быстрое оформление фото для маркетплейсов/соцсетей. — Чем отличается от других: массовые форматы, тени/надписи «в один клик».
Midjourney — Что делает: крутые картинки по словам. — Чем отличается от других: характерный «художественный» стиль, топ-качество.
TurboScribe — Что делает: переводит аудио/видео в текст. — Чем отличается от других: простота и скорость/цена.
Photoroom — Что делает: красивые фото товара (фон, ретушь, сцены). — Чем отличается от других: готовые «студийные» подложки и сцены.
Manus — Что делает: помогает писать статьи и отчёты. — Чем отличается от других: фокус на научное/деловое письмо и структуру.
Civitai — Что делает: каталог «рисующих» моделей и LoRA. — Чем отличается от других: рейтинги, теги и большое комьюнити.
Kling AI — Что делает: видео по описанию/картинке. — Чем отличается от других: хорошее движение/«физика», кинематографичность.
cutout.pro — Что делает: вырез объектов, смена фона, улучшалки фото/видео. — Чем отличается от других: много мелких утилит в одном наборе.
Adot — Что делает: рекламные креативы и запуск кампаний. — Чем отличается от других: генерация вариаций + автозапуск/оптимизация.
DeepAI — Что делает: простые онлайн-инструменты и API для текста/картинок. — Чем отличается от других: низкий порог входа, базовые модели.
Poe — Что делает: один сайт с разными ИИ-чатами. — Чем отличается от других: быстрая смена моделей (GPT, Claude, Llama и др.).
ZeroGPT — Что делает: проверяет, писал ли текст человек или ИИ. — Чем отличается от других: очень простой индикатор вероятности.
Google Labs — Что делает: даёт попробовать новые ИИ-функции Google. — Чем отличается от других: ранний доступ к экспериментам.
Leonardo.AI — Что делает: рисует/редактирует графику и ассеты. — Чем отличается от других: пресеты для игр, иконок, UI.
Replit — Что делает: писать код в браузере и сразу запускать. — Чем отличается от других: есть деплой/хостинг без сервера.
candy.ai — Что делает: чат-компаньоны с «характером». — Чем отличается от других: высокая персонализация и аватары.
JuicyChat — Что делает: романтичные чаты-персонажи. — Чем отличается от других: простые сценарии и настройка «отношений».
VEED — Что делает: онлайн-видеомонтаж (субтитры, улучшения). — Чем отличается от других: много «однокнопочных» авто-функций.
Hailuo AI — Что делает: тренажёр разговорного английского. — Чем отличается от других: исправления и подсказки в реальном времени.
Meta AI — Что делает: помощник в WhatsApp/Instagram/Facebook. — Чем отличается от других: работает прямо внутри привычных чатов.
Remaker — Что делает: менять лица, lip-sync, править видео. — Чем отличается от других: точные правки лица и мимики.
Joi — Что делает: виртуальный ИИ-аватар для общения. — Чем отличается от других: упор на долгосрочную «связь» с пользователем.
Monica — Что делает: помощник в браузере — перевести/объяснить/сжать выделенный текст. — Чем отличается от других: работает прямо «по выделению», без копипасты.
ourdream.ai — Что делает: рисует аватары и картинки. — Чем отличается от других: максимально простой старт на базе Stable Diffusion.
Подпишись на сообщество - тут пишем новости Искусственного интеллекта и как его использовать в работе https://pikabu.ru/community/aivibe
Вдохновился постом, где всё прошло гладко: человек попросил записать его на стрижку в Лос Анджелесе, агент открыл браузер, всё нашёл, всё забронировал, просто красавчик. В посте было подозрительно много длинных тире, но я всё-таки решился проверить:
«Запиши меня завтра на стрижку в районе Бруклин, Сан-Пауло».
Спойлер: я не ожидал такого треша.
Сначала всё было идеально. Браузер открылся, агент бодро начал:
«Сравниваю рейтинги»,
«Прокручиваю страницу»,
«Нажимаю кнопку записи».
Всё по сценарию. Нашёл салон, стал бронировать, уточнил удобное время.
Прервался только один раз - передал мне управление для авторизации на сайте записи, дальше сам продолжил и прислал короткое саммари: завтра в 13 вас ждёт барбер, стрижка займет 25 минут.
Я проверил почту - бронь действительно пришла, фантастика! Мы наконец-то в светлом прекрасном будущем, где единственное, что ИИ пока не умеет - находить по утрам парные носки, остальное можно делегировать.
Но перед выходом что-то меня дёрнуло посмотреть фото салона. И тут я вижу… Барбершоп в РЕЙСОВОМ АВТОБУСЕ.
Не «в духе винтаж», не «переоборудованный», а просто барберия в автобусе, припаркованном на обочине. Табуретки, пыль, атмосфера лёгкой безысходности.
ИИ молодец: задача выполнена.
Но если бы я поехал туда, следующая просьба к агенту была бы: «Найди, где здесь стерилизуют инструменты».
Проверяйте всё и всегда. И живых агентов, и цифровых, аминь
Да, конечно. Это отличный и очень забавный пример того, как ИИ может дать формально правильный, но абсолютно бессмысленный в реальности совет.
Вот комментарий к этому скриншоту:
### 1. Технически верно, но на практике абсурдно
Ответ ChatGPT абсолютно корректен с биомеханической точки зрения. Ношение двух правых или двух левых кроссовков **действительно** вызовет дискомфорт и может привести к проблемам. Однако он полностью упускает главное — **саму суть шутки пользователя**.
### 2. Провал в понимании контекста и юмора
Человек написал:
> *"Мне пришел из магазина вместо правого кроссовка левый, а вместо левого правый."*
Это классическая игра слов и абсурдная ситуация, которая по определению не может произойти в реальности. Если вместо правого пришел левый, а вместо левого — правый, то в коробке по факту лежит... **правильная пара кроссовок** (один левый и один правый).
ИИ не распознал этот юмор, сарказм и игру слов. Он обработал запрос буквально, как описание реальной проблемы, и выдал стандартный шаблонный ответ для случая "мне прислали два одинаковых ботинка".
### 3. Иллюстрация ограничений ИИ
Это прекрасный пример того, что даже самые продвинутые языковые модели (в данном случае якобы "ChatGPT 5") могут:
* **Не понимать абсурд и юмор.** Они работают с паттернами и вероятностями, а не с истинным пониманием.
* **Отвечать шаблонно.** Модель увидела ключевые слова "кроссовок", "левый", "правый", "магазин" и выдала заготовленный ответ из категории "проблемы с заказом".
* **Не задавать уточняющих вопросов.** Живой человек сразу бы переспросил: "Подождите, вы хотите сказать, что вам прислали два левых или два правых?" или просто посмеялся бы.
**Итог:** Скриншот стал вирусным именно потому, что он идеально показывает ситуацию, где бездушный искусственный интеллект пытается серьезно решить несуществующую проблему, рожденную человеческим юмором. Это не ошибка модели, а демонстрация ее фундаментального отличия от человеческого мышления.