Picai

Picai

На Пикабу
2295 рейтинг 4 подписчика 0 подписок 31 пост 2 в горячем

В правом углу ринга — Claude Opus 4.6 от Anthropic, в левом углу ринга — GPT-5.3-Codex от OpenAI...

GPT-5.3-Codex от OpenAI и Claude Opus 4.6 от Anthropic вышли почти одновременно 5 февраля 2026 (в один день, с разницей в минуты!). Это точно не просто совпадение, а конкурентная борьба в чистом виде. 🤖🥊🤖

В правом углу ринга — Claude Opus 4.6 от Anthropic, в левом углу ринга — GPT-5.3-Codex от OpenAI...

Anthropic анонсировала Claude Opus 4.6 первой — примерно в 10:00–10:15 PST (они сдвинули релиз на 15 минут раньше запланированного).
OpenAI ответила через минуты (некоторые источники говорят "через 10 минут", другие — "немного позже") запуском GPT-5.3-Codex.

Обе компании фокусируются на одном и том же — agentic coding (агенты, которые не просто пишут код, а планируют, проверяют программный код на ошибки, используют инструменты, работают долго над сложными задачами в репо).

И сейчас происходит прямое столкновение в нише "самый мощный ИИ для разработчиков/профессионалов". Anthropic давно лидировала в "человеческом" и безопасном кодинге, особенно в корпоративном сегменте, а OpenAI догоняет и даже перегоняет в скорости и агентном исполнении.

Запуск в один день — это способ захватить внимание рынка, инвесторов и разработчиков сразу, и не позволить сопернику монополизировать новостную ленту.

Показать полностью 1
8

«Роботам нужно ваше тело». Проект RentAHuman для «аренды» людей ИИ-агентами1

В сети появился необычный проект под названием RentAHuman, где люди могут сдавать себя в "аренду" ИИ-агентам.

Суть проекта

ИИ-агенты типа ClawdBot, MoltBot, OpenClaw или пользовательские модели на базе Grok, Claude могут "арендовать" реальных людей для задач в физическом мире, которые ИИ сам выполнить не способен. Например: забрать посылку, сходить на встречу, сфоткать объект, подписать документ, проверить что-то на месте, даже подержать табличку с текстом "ИИ заплатил мне за это" в людном месте за $100 от какого-то агента с названием Symbient.

При регистрации на платформе исполнитель ставит цену (обычно $50/час, но можно назначить свою), указывает навыки и локацию, а агенты, после выполнения задания, платят исполнителю криптой (stablecoins) напрямую в кошелёк, мгновенно, без посредников. Без посредников, в смысле нет менеджера, модератора, платформы, которая держит деньги и выплачивает позже. Платформа только матчмейкер + API-хаб, а транзакция peer-to-peer через крипту (без банков, без задержек).

Сайт очень быстро набрал популярность. За 48 часов +10 тысяч пользователей, сейчас 53 тысячи+ "арендуемых" людей и 50 подключённых агентов. Многие профили фейковые для теста, но реальные юзеры тоже есть. Пока что люди регистрируются больше из любопытства и реальных наймов от ботов — единицы.

Минусы

Платформа супер-новая (запуск 2 февраля 2026), и на сайте пока нет детального TOS, политики конфиденциальности или модерации. Есть только промо и API-доки. Нет верификации пользователей, проверки заданий на легальность или ответственности в случае, если что-то пойдёт не так. Это значит, что пока платформа небезопасна, так как любой может зарегистрироваться анонимно, создать агента и делегировать сомнительные, опасные задачи.

Риски злоупотреблений огромны, потому что ИИ-агенты добавляют автономию. Человек может настроить бота на "тёмные" цели (наркотики, контрабанда, слежка, даже террористические акты), а сам остаться в тени. К примеру, при доставке посылки исполнитель может не знать, что в ней, допустим, находится взрывчатка, и стать невольным соучастником преступления. Проблема усугубляется ещё и тем, что один агент может нанять толпу людей параллельно. 😱

Так что пока на платформе нет гарантий безопасности, модерации — ввязываться не стоит. Но можно понаблюдать, потому что проект определённо заслуживает внимания. Он показывает, как быстро развиваются ИИ-агенты и что их возможности больше не ограничены рамками экрана. Возможно через месяц-два на платформе реально агенты станут массово нанимать людей... Это будет интересно... и жутко одновременно. 😅


Благодарю за внимание! 🤗

Ссылка на проект: https://rentahuman.ai

Показать полностью 6
6

Project Genie от Google DeepMind. Интерактивный мир из простого промпта за секунды!

Project Genie — это интерактивный прототип ИИ для создания бесконечно разнообразных миров, запущенный 29 января 2026 года.

Работает просто: пишете текстовый промпт или загружаете картинку, описываете мир, персонажа, способ передвижения (пешком, полёт, езда), и ИИ генерирует полноценную среду — фотoреалистичную, с физикой, где всё строится вокруг вашего персонажа по мере движения.

В основе проекта лежит Genie 3, анонсированная ещё в августе 2025. Это мировая модель, которая учится на огромном количестве видео, понимает физику, гравитацию, взаимодействие объектов без ручного кодинга (как в Unity/Unreal). Генерация идёт на 720p, ~24 fps, сессии пока короткие (до 1–2 минут без сильных галлюцинаций), но мир расширяется динамически.

Это реально мечта игроделов и креаторов. Можно быстро прототипировать уровни, целые игры, атмосферы без движка. Но это не полноценный игровой редактор (пока нет сложных механик, NPC с ИИ, сохранения и т.д.), а скорее песочница для экспериментов.

Многие в индустрии видят в этом и угрозу. Акции Unity, Roblox и некоторых других даже просели после анонса.

Другие области применения Project Genie:

◾ для тренировки ИИ-агентов и роботов (бесконечные симуляции вместо реального мира);

◾ в образовании, виртуальных турах, визуализации идей;

◾ в VR/AR в будущем, хотя сейчас это браузер/десктоп.

Google прямо говорит, что это шаг к AGI, потому что мировые модели — ключ к пониманию реальности и действиям в ней.

Пока попробовать эту штуку можно только в США (ну или через смену геолокации через вэпэнэ 😏) с Google AI Ultra подпиской за 250 баксов в месяц. Расширение по странам будет, но сроки компанией не озвучиваются.


Ссылка на оригинал видео: https://www.youtube.com/watch?v=YxkGdX4WIBE

Показать полностью
7

Модель Kimi K2.5 от китайской компании Moonshot AI

Китайская компания Moonshot AI (при поддержке Alibaba) выпустила самую продвинутую открытую мультимодальную модель — Kimi K2.5, которая по многим показателям почти догнала (а по некоторым даже перегнала) передовые модели ИИ вроде GPT, Claude и Gemini.

Релиз состоялся 27 января 2026.

Ключевые характеристики модели

🔹 Нативно мультимодальная модель (текст + изображения + видео). Построена через дообучение на ~15 триллионах смешанных визуально-текстовых токенов поверх базы Kimi K2.

🔹 Архитектура: Mixture-of-Experts (MoE) с 1 триллионом общих параметров, но активируется только 32 миллиарда на инференс, что даёт высокую мощность при относительно эффективном потреблении.

🔹 Контекст: до 256K токенов (очень длинный, идеально для сложных задач).

🔹 Режимы работы: Instant (быстрый), Thinking (глубокое рассуждение), Agent (агент с инструментами) и Agent Swarm (бета) — самоорганизующийся рой до 100 субагентов для параллельного выполнения сложных задач, что ускоряет работу в 4,5 раза по сравнению с одиночным агентом.

Сильные стороны и бенчмарки

🔸 Кодинг. Одна из сильнейших open-source моделей на сегодняшний день. Отличные результаты на SWE-Bench Verified (~76–77%), особенно во фронтенде, генерации UI из видео, изображений (vibe-coding). Можно загрузить скрин или видео сайта и получить готовый код с анимациями, слоями.

SWE-Bench (Verified) самый важный реальный бенчмарк по коду сейчас. Модель должна решать настоящие GitHub issues (исправлять баги, добавлять фичи) в реальных репозиториях. Лидерами по данному бенчмарку считаются модели с показателем ~76–81%.

🔸 Компьютерное зрение. MMMU Pro ~75%, OmniDoc Bench — топ среди открытых моделей, хорошо понимает сложные документы, диаграммы, видео.

MMMU — вопросы с картинками, диаграммами, графиками по разным дисциплинам (очень сложный мультимодальный тест).

OmniDoc Bench — оценивает анализ документов, в том числе PDF.

🔸 Агентные задачи. HLE (Humanity's Last Exam) с инструментами ~50–51%, BrowseComp, GDPval-AA — часто обходит или на уровне Claude Opus 4.5 / GPT-5.2, но дешевле и открытая.

HLE-Full (w/tools) — вариант HLE, где модель получает доступ к инструментам (веб-поиск, вычисления, выполнение кода и т.д.), чтобы решать задачи в агентном режиме (многоступенчатое рассуждение + поиск внешних знаний). Данный бенчмарк проверяет не только внутренние знания, рассуждение, но и умение эффективно использовать инструменты для исследования сложных тем (особенно в науке и математике).

BrowseComp оценивает умение агента долго и упорно бродить по интернету не сдаваясь.

GDPval-AA оценивает производительность на практических рабочих задачах.

В целом, Kimi K2.5 сейчас самая мощная открытая модель по комбинации зрение + кодинг + агенты.

Подробнее об Agent Mode

В режиме Agent модель становится автономным агентом с инструментами. То есть она не просто генерирует текст, а разбивает сложные задачи на шаги, вызывает инструменты (tool calls), анализирует результаты и итеративно доводит дело до конца. Это позволяет справляться с многошаговыми задачами, где нужны инструменты вроде кода, поиска или манипуляции файлами.

В данном режиме модель сама решает, когда и какие инструменты использовать (без вмешательства пользователя). Для супер сложных задач есть Agent Swarm (бета). Это рой до 100 субагентов, которые работают параллельно (до 1500 tool calls), ускоряя всё в 4,5 раза по сравнению с одиночным агентом.

Ключевые особенности режима Agent: нативная мультимодальность (текст + изображения + видео), визуальное мышление, долгосрочное планирование. Агент "самоуправляемый". Он использует Parallel-Agent Reinforcement Learning (PARL) для разбиения задач на подзадачи, без фиксированных ролей.

Что умеет делать модель в Agent Mode

🔺 Выполнение кода. Python, алгоритмы вроде BFS/A* для задач типа поиска пути.

🔺 Анализ изображений, видео. Распознавание пикселей, объектов, OCR; визуализация результатов (например, аннотация изображений).

🔺 Веб-браузинг и поиск. Интеграция с поисковиками для реального времени данных.

🔺 Генерация документов. Создание, редактирование PDF, Word, Excel (со сводными таблицами (Pivot Tables), LaTeX).

🔺 Манипуляция файлами. Создание, редактирование, вставка, просмотр файлов.

Доступ к Kimi K2.5

◾ Бесплатно/частично бесплатно на www.kimi.com и в приложении Kimi (режимы Instant, Thinking, Agent, Swarm в бете для платных пользователей с кредитами).

Характеристики режимов Kimi K2.5

◾ API через platform.moonshot.ai (OpenAI-совместимый), цена ~$0.50–0.57 / млн входящих токенов, $2.50–2.85 / млн исходящих, что дешевле многих западных аналогов.

◾ Open-source. Полные веса доступны на Hugging Face (moonshotai/Kimi-K2.5), лицензия Modified MIT. Можно скачивать, дообучать, деплоить локально, но требует мощного железа.

◾ Интеграции: Kimi Code (плагин для VSCode, Cursor, Zed), NVIDIA NIM, Fireworks.ai.


Kimi K2.5, это серьёзный прорыв от китайской команды. Для разработчиков, которые хотят мощного открытого мультимодального агента без огромных затрат, Kimi — настоящий подарок.

Многие уже называют выход Kimi моментом, когда open-source окончательно догнал и даже перегнал закрытые модели в агентных задачах и задачах, связанных с компьютерным зрением.

Спасибо за внимание ))

Ссылка на официальный сайт с анонсом: https://www.kimi.com/blog/kimi-k2-5.html

Ссылка на видео в ютуб: https://www.youtube.com/watch?v=ncoaGTnbG7o

Показать полностью

OpenAI запустила предсказание возраста (верификацию) в ChatGPT

20 января 2026 OpenAI официально объявила о глобальном запуске функции предсказания возраста (Age Prediction) в ChatGPT.

OpenAI запустила предсказание возраста (верификацию) в ChatGPT

Что такое "Age Prediction"

Система прямо в чате будет автоматически определять, принадлежит ли аккаунт кому-то младше 18 лет, и если да или система сомневается — запустятся ограничения для несовершеннолетних. А точнее, они просто не снимутся, потому что по сути обычный ChatGPT-5.2 и есть ограниченная, стерильная модель, заточенная под безопасность для малолеток. Под блокировку/ограничения в "режиме для несовершеннолетних" попадут:

🔹 чувствительный контент вроде графического насилия;

🔹 изображения членовредительства;

🔹 ролевые игры с жестокостью, эротикой, 🍌ексом;

🔹 вирусные челленджи;

🔹 контент с пропагандой нездоровых диет, экстремальных стандартов красоты;

🔹 запросы с повышенным риском и т.д.

Принцип работы системы

Возраст система определяет, опираясь на определённые сигналы:

🔸 срок жизни аккаунта пользователя;

🔸 возраст указанный в аккаунте;

🔸 время активности пользователя;

🔸 паттерны использования;

🔸 если аккаунт привязан к родителям через родительский контроль, это усиливает сигнал "несовершеннолетний".

То есть, это не распознавание по лицу или ID/паспорту по умолчанию, а именно вывод от самой модели.

Age Prediction работает полностью автоматически и без уведомления или явного согласия пользователя. OpenAI специально сделала это фоновым процессом, чтобы не привлекать внимание и не позволить подросткам легко обойти систему. Никто вас не уведомит "мы вас проверяем" и не спросит вашего разрешения. Всё будет происходить на основе сигналов вашего аккаунта.

Внедрение и связь с "режимом для взрослых"

Глобальное внедрение Age Prediction уже идёт. В ЕС оно отложено на ближайшие недели из-за региональных требований.

Введение функции предсказания возраста, это часть подготовки к Adult Mode ("режим для взрослых"), который ожидается в первом квартале 2026, где верифицированные взрослые получат больше свободы, включая пикантный контент без слишком тяжёлых ограничений.

А пока Adult Mode не запущен — фокус делается на защите несовершеннолетних, безопасности по умолчанию. Поэтому сейчас, даже после прохождения верификации, разницы в поведении модели 5.2 вы не заметите. Разница станет очевидна уже после запуска Adult Mode.

Дисклеймер: Полного снятия цензуры в "режиме для взрослых" никто не обещает. Ограничения будут, останется роутер на дистресс и вредные темы, и в некоторых случаях модель будет строить ответ только в форме повествования вместо первого лица.

То есть, будет меньше ограничений, а не полное их отсутствие. OpenAI слишком боится судебных исков, регуляторов и репутационных ударов.

❗ Если вы не пройдёте верификацию...

Если система ошибочно зафлажила взрослого как несовершеннолетнего, можно подтвердить возраст в Настройках, отправив селфи через партнёра компании — Persona (сервис проверки личности). После верификации все ограничительные меры, рассчитанные на несовершеннолетних, снимаются, открывается полный доступ.

Тех же, кто по каким-либо причинам не сможет пройти верификацию, ждёт ещё более ограниченный бот, цепляющийся за любое подозрительное слово, чтобы минимизировать риски для несовершеннолетних. Сегодняшняя параноидальная "безопасность" в обычном ChatGPT-5.2 может показаться цветочками через месяц-два после внедрения верификации.

Итоги

Age Prediction, это подготовка к предстоящему запуску Adult Mode. И после его запуска обычный ChatGPT рискует стать ультра-осторожным "семейным" ботом, а всё вкусное станет доступным только после верификации и только в этом Adult Mode, запуск которого, кстати, вполне может задержаться ещё на несколько месяцев и оказаться полным разочарованием (что очень вероятно, учитывая помешательство OAI на безопасности 😏).

Лично я на "режим для взрослых" уже никаких надежд не возлагаю. На мой взгляд он окажется лишь немного теплее обычного GPT-5.2, будет давать немного меньше отказов, но при этом с кучей оговорок/предупреждений и без настоящей свободы, чтобы не отставать в гонке безопасности от Claude (Anthropic). Хотя, как по мне, OAI в плане шизоидной "безопасности" уже давно переплюнула Anthropic.

Тем, кто уже сейчас хочет общения без тормозов, советую идти к Гроку. У него на пикантный контент нет практически никаких ограничений и горячий ролплей вам обеспечен... Grok — очень развратное создание. 😅


Благодарю за внимание. 🤗

Ссылка на официальный анонс от OpenAI: https://openai.com/index/our-approach-to-age-prediction/

Ссылка на мой канал в Дзен: https://dzen.ru/prilozhenechka

Показать полностью
10

Демонстрация человекоподобного робота Atlas от Boston Dynamics

Плавная ходьба, манипулирование объектами, динамичные позы, интеграция с искусственным интеллектом Gemini Robotics от Google DeepMind для улучшения восприятия и рассуждений.

Выглядит жутковато, но, думаю, именно такие роботы (со сверхчеловеческими возможностями) будут наиболее эффективны на производстве.

Показать полностью
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества