TL;DR Меня зовут Илья, я основатель сервиса для генерации изображений ArtGeneration.me, блогер и просто фанат нейросетей. Каждую неделю мы с командой осматриваем сотни новостей и делимся с вами самыми актуальными и интересными со ссылками на источники. Всё самое важное — в одном месте. Поехали!
Неделя вышла плотной: Anthropic выкатила Opus 4.7 и Claude Design, OpenAI прокачала Codex до компьютерного агента. Открытые TTS от Google и генератор картинок от Baidu. Бренд кроссовок теперь ИИ-компания, а ИИ-кавер «Седой ночи» от Канье топ-2 Shazam.
Всё самое важное — в одном месте. Поехали!
Gemini 3.1 Flash TTS — 70+ языков, аудио-теги прямо в тексте, есть бесплатный тир
ERNIE Image от Baidu — открытый генератор картинок, запускается на 24 ГБ
Взлом SynthID — исследователь убрал водяной знак Google с точностью 91%
🔧 AI-инструменты и платформы
Бесплатное приложение Gemini для macOS
Codex от OpenAI теперь управляет вашим ПК
Claude Design — инструмент для прототипов, презентаций и макетов
🧩 AI в обществе и исследованиях
Разработчик заставил OpenClaw писать доносы про уклонение от налогов
Allbirds: бренд кроссовок продал обувь за $39 млн и купил GPU на $50 млн
«Седая ночь» от ИИ-Канье: топ-2 глобального Shazam
Биксонимания — девушка придумала болезнь, в которую поверили нейросети
🧠 Модели и LLM
❯ Claude Opus 4.7 — новый флагман Anthropic
Anthropic выпустили Claude Opus 4.7 — самую сильную из публично доступных моделей компании. Модель прокачали в тяжёлых задачах: длинные кодовые пайплайны, сложные многошаговые цепочки, агентная работа.
По SWE-bench Pro результат вырос с 53,4% до 64,3% относительно Opus 4.6. Ранние тестеры отмечают, что теперь можно делегировать задачи, которые раньше требовали постоянного надзора, потому что модель стала валидировать ответы перед отправкой.
Vision. Модель теперь видит изображения втрое чётче — до 3,75 МП. Скриншоты, схемы, плотные таблицы — всё это агенты теперь читают без потерь.
Новый уровень рассуждений xhigh. Добавили ступень между high и max — для задач, которым нужно думать подольше. В Claude Code он теперь стоит по умолчанию.
Task Budgets (бета). Ограничитель токенов на одну задачу — чтобы модель не уходила в бесконечный цикл на простом запросе.
Память. Лучше держит контекст в длинных многосессионных сценариях.
Цена API та же — $5 / $25 за миллион токенов. Есть нюанс: новый токенизатор на том же тексте может тратить до 35% больше токенов.
Ещё одно предупреждение от Anthropic: модель интерпретирует инструкции буквально. Промпты, заточенные под 4.6, могут давать неожиданный результат.
❯ Qwen 3.6 35B-A3B — открытая MoE от Alibaba
Alibaba выпустила Qwen 3.6 35B-A3B — MoE-модель с 35 млрд параметров, из которых на каждый токен активируются только и 3 млрд. За счёт этого она быстрее и дешевле других моделей сопоставимого размера.
В коде обходит Qwen 3.5 27B dense, особенно заметен прирост в агентном кодинге и рассуждении. Модель видит картинки и работает с ними. На ряде vision-тестов результаты сопоставимы с Claude Sonnet 4.5 или выше.
Веса открытые, лицензия Apache 2.0, контекст 262k токенов. Unsloth уже сделали GGUF — в 4-битном режиме запускается локально на 23 ГБ ОЗУ и Mac.
🎨 Генеративные нейросети
❯ Gemini 3.1 Flash TTS — новая TTS от Google
Google выпустили Gemini 3.1 Flash TTS. Главная фишка — audio tags прямо в тексте: пишете [cough] или [whispers], и модель вставляет кашель или переходит на шёпот. Всего 200+ таких тегов. Они только на английском, но работают, даже если сам текст на другом языке.
Поддерживает 70+ языков, 30 готовых голосов. Google позиционируют модель для аудиокниг, подкастов и голосовых агентов. Всё автоматом маркируется SynthID-водяным знаком.
Доступна в превью через Google AI Studio и Vertex AI. В AI Studio можно тестировать бесплатно.
❯ ERNIE Image от Baidu — открытый генератор картинок
Baidu открыли ERNIE Image — генератор картинок на 8B параметров. Архитектура проще, чем у Flux: текст и изображение обрабатываются в одном трансформере сразу, без параллельных веток.
Главная сильная сторона — рендеринг текста внутри картинки: постеры, UI, сторибординг, многоязычные подписи.
В комплекте идёт Prompt Enhancer — лёгкая модель, которая разворачивает короткий промпт в подробное описание. Можно запускать и без неё. Есть Turbo-версия на 8 шагов, на H200 генерирует за 11 секунд.
Запускается на 24 ГБ VRAM, веса под лицензией Apache 2.0.
❯ Взлом водяного знака SynthID
Исследователь Алош Денни опубликовал reverse-SynthID — открытый проект для удаления водяного знака SynthID из изображений Gemini.
SynthID — невидимая метка Google в ИИ-генерациях, которая не видна глазу. Именно её ищут детекторы.
Всё просто: он взял прогнал чёрные и белые фоны через модель, вытащил шаблон скрытого шума и упаковал в словарь. Дальше этот словарь вычитается из нужной картинки. По заявленным метрикам визуальное качество почти не страдает.
Оговорка: шаблон зависит от разрешения, под каждое нужен свой профиль. Автор уже зовёт комьюнити пополнять базу пулл-реквестами.
Сам факт публикации бьёт по идее, что водяные знаки надёжно отделяют ИИ-контент.
🔧 AI-инструменты и платформы
❯ Бесплатное приложение Gemini для macOS
Google выпустили нативное приложение Gemini для macOS. Работает на macOS 15 Sequoia и выше, бесплатно.
Вызывается через Option + Space поверх любого окна. ИИ-ассистент умеет анализировать ваш экран. Вы можете прямо во время работы открыть чат, показать сложную таблицу и попросить составить формулу. Или спросить, как вырезать фон в открытом Photoshop.
❯ Codex от OpenAI теперь управляет компьютером
OpenAI выкатили крупное обновление Codex. Главный апгрейд — computer use: агент видит экран, двигает курсор и работает через GUI. Несколько агентов могут работать параллельно, не отбирая фокус у пользователя.
Встроенный браузер: комментарии прямо на элементах страницы, точечные инструкции агенту. Пока для localhost, полноценный веб обещают позже.
Генерация картинок через gpt-image-1.5 прямо внутри воркфлоу.
90+ плагинов: Jira, GitLab, Microsoft 365, Notion, Slack и другие.
Память запоминает предпочтения и контекст между сессиями.
Автоматизации по расписанию: агент сам просыпается, подтягивает контекст и собирает список задач на день.
Computer use пока только на macOS. Память и персонализация для пользователей из EU и UK появятся позже.
❯ Claude Design — инструмент для прототипов и макетов
Anthropic выпустили Claude Design на базе Opus 4.7. Генерирует прототипы интерфейсов, лендинги, презентации и маркетинговые материалы.
Механика чуть отличается от привычных генераторов: сначала заполняете анкету: жанр, экраны, настроение, палитра. Только после получаете 4 варианта черновиков на выбор. Дальше дорабатываете через инлайн-правки и слайдеры.
Инструмент читает дизайн-файлы компании и автоматически применяет дизайн-систему к новым проектам. Готовый результат экспортируется одним кликом в Canva, PDF, PPTX, HTML.
Доступно в research preview для подписчиков Pro, Max, Team и Enterprise. Для Enterprise по умолчанию выключено — включает администратор.
Акции Figma упали на 7,5% сразу после анонса.
🧩 AI в обществе и исследованиях
❯ Разработчик сделал из OpenClaw доносчика
Чел настроил OpenClaw-агента на очень необычную задачу: мониторить соцсети и собирать посты, где люди хвастаются неуплатой налогов с крипты, ставок или наличных — и автоматически отправлять их в IRS Whistleblower Office.
IRS платит информаторам 15–30% от взысканных сумм. Автор рассчитывает заработать $500 тысяч в год и уже якобы отправил 4 250 репортов.
Сработает ли схема — вопрос. Программа IRS квалифицирует кейс только если сумма спора превышает $2 млн, а информация «специфична и достоверна». Данные из публичных постов исторически не проходят этот порог. Налоговые юристы уже разобрали кейс и говорят прямо: «нашёл твит — получил 30%» так не работает.
❯ Allbirds продала кроссовки и купила GPU
Allbirds — обувная компания, которую на IPO в 2021 году оценивали в $4 млрд. Она договорилась продать все активы и название American Exchange Group за $39 млн. Это примерно 1% от пика.
Публично компания остаётся на бирже и переименовывается в NewBird AI. Но уже с новым планом: взять $50 млн конвертируемого финансирования и стать провайдером GPU-as-a-Service, то есть закупить железо и сдавать его в аренду стартапам.
На новости акции в моменте подскочили более чем в шесть раз за день. Аналитики называют это классическим AI-хайп сценарием: у команды нет опыта в облачной инфраструктуре, стратегии пока нет, а сделка ещё ждёт одобрения акционеров и закрытия в Q2 2026.
❯ ИИ-кавер «Седой ночи» с голосом Канье — топ-1 мирового Shazam
Турагент из Ижевска сделал ИИ-кавер «Седой ночи» с синтетическим голосом Канье Уэста. По его словам, на всё ушло три минуты. Видео со склейкой из концертных кадров набрало 6 млн просмотров и разлетелось по соцсетям.
Трек Silver Night залетел на первое место глобального чарта Shazam Top 200.
Но дальше интереснее. На стриминги трек появился уже под именем Bad Style & Tender May — без указания автора и без денег ему. Создатель публично обвинил в перезаливе бывшего продюсера «Ласкового мая» Андрея Разина. Тот в Instagram подтвердил причастность к релизу.
Теперь вокруг трека, который «никто не пел», идёт спор о правах и роялти.
❯ Биксонимания — болезнь, которой не существует
Шведская исследовательница из Гётеборгского университета придумала несуществующую болезнь биксониманию — якобы розовение век от долгого сидения за экраном. Загрузила фейковые препринты на научные площадки и стала ждать.
Чтобы проверить, насколько внимательно LLM читают источники, в статьях оставили кучу подсказок: в благодарностях значилась «Академия Звёздного флота на борту Энтерпрайза», спонсором — «Фонд Сайдшоу Боба по части продвинутого мошенничества», а в тексте прямо написали «Вся статья выдумана».
Не помогло. Copilot назвал биксониманию «редким и интригующим состоянием». Gemini выдавал советы по лечению и отправлял к офтальмологу. Perplexity сгенерировал статистику из воздуха: болезнь поражает 1 из 90 000 человек. ChatGPT тоже не устоял.
Но главное не это. Индийские авторы опубликовали в рецензируемом журнале Cureus статью, где процитировали фейковый препринт как реальный источник. Публикацию потом отозвали — но факт остался: выдуманный диагноз успел пройти через цепочку научного цитирования.
❯ Тема недели: синий экран смерти
20 апреля 1998 года на выставке COMDEX во время презентации Windows 98 Билл Гейтс и его помощник Крис Капоссела попытались продемонстрировать технологию Plug and Play. При подключении сканера система моментально вылетела в BSOD (Синий экран смерти) на глазах у огромной толпы.
Это самый честный момент в истории Microsoft. «Наверное, поэтому мы пока не выпускаем Windows 98» — такая реакция была у Гейтса, и она стала эталоном антикризисного пиара, а сам BSOD — главным визуальным кодом эпохи.
❯ Аудиоверсия дайджеста
❯ Заключение
На этой неделе главный инфоповод — Anthropic: новый флагман Opus 4.7 и сразу отдельный продукт для дизайнеров. OpenAI ответили апгрейдом Codex до полноценного компьютерного агента. Google и Alibaba открыли новые модели для голоса и картинок.
Но интереснее смотреть на периферию. Производитель кроссовок меняет GPU на обувь и взлетает на 600%. Турагент из Ижевска делает мировой хит за три минуты. Выдуманная болезнь просачивается в рецензируемый журнал. ИИ-агент превращается в доносчика.
Инструменты становятся мощнее, но самые показательные истории недели — не про бенчмарки. Они про то, что происходит, когда эти инструменты попадают в руки обычных людей.
А я рассказываю о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке.