Synthwave Neuro Arts
8 постов
8 постов
2 поста
Друзья, всем привет, сегодня хочу рассказать, как создавать симпатичные аниме арты прямо в браузере, используя онлайн сервис работающий на нейросети Stable Diffusion.
Теперь вам не нужно иметь мощную видеокарту, достаточно написать запрос, можно даже на русском, и в течении минуты получите изображение. Но как создавать изображения именно в Аниме стиле? Обо всем по порядку.
Сначала регистрируемся на ArtGeneration.me - ссылка реферальная, зарегистрировавшись по ней вы получите 7 дней PRO, вместо 3 и 200 дополнительных генераций, вместо 100 на баланс, так что решайте сами 😁. На сайте вам ежедневно будет начисляться 50 генераций, а если оформите подписку PRO, то 300, жду шутку про тракториста в комментарии.
С регистрацией никаких проблем не возникнет, можно авторизоваться с помощью Яндекса или Гугла, и сразу попадаем в галерею изображений.
В галерее можно увидеть что сейчас создают пользователи и сразу сделать свою версию. По клику на любую картинку вы сможете увидеть по какому запросу она была создана.
То что получится на изображении описывается с помощью запроса и негативного запроса, так нейросеть понимает, что рисовать, а что не рисовать. Запросы можно писать на русском, они будут автоматически переводится. Но мы будем писать на английском, потому что примеры, которые мы будем находить на сайте где размещают модели тоже будут на английском.
Самый просто способ сделать красиво, это найти что-то, что вам нравится нажать на кнопку Создать свою версию, так вы откроете изображение с теми же настройками с которыми оно было создано. Останется поменять несколько слов в запросе и получить то что хочется именно вам. Изучим основные настройки.
По клику на иконку рядом с названием модели откроется страница со всеми созданными на этой модели картинками
Настройки генерации скрыты в правом баре, если у вас маленький экран, то он может быть скрыт по умолчанию, нажмите на стрелочку, чтобы развернуть.
Самое важное это модель, от модели зависит буквально все, ниже я расскажу какие модели лучше всего подходят для Аниме стилистики.
Разрешение, на моделях 1.5 (те, где в названии нет XL), важно не выходить за разрешение 512х768 или 768х512, но есть и хитрость, можно пропорционально увеличить разрешение до 960х640 или обратно, так качество изображений будет выше. На XL моделях можно смело делать разрешение больше.
Стили это маленькие предустановленные кусочки запросов, они добавляются к запросу который пишите вы, стили очень удобно использовать с простым запросом в 1 - 2 предложения, если копируем откуда-то промпт, то стиль использовать не стоит.
В Избегать пишется негативный запрос, то, чего не должно быть на изображении, лучше всего его взять из готовых примеров, или на сайте где размещают модели. Остальные настройки можно в принципе не менять, по умолчанию они работают хорошо.
Свое изображение позволяет загрузить любое фото или картинку из интернета и получить генерацию которая будет очень похожа на то, что вы загрузите, степень изменения загруженной фотки можно регулировать ползунком.
Сюда же можно отправить вашу генерацию, например, чтобы сделать что-то похожее, но с другим запросом. А если не нравится только одна часть, её можно закрасить маской и тогда закрашенная часть будет пере генерирована. Так например можно улучшить лицо.
Если не хотите чтобы ваши изображения попадали в общую галерею, можно включить приватный режим.
Проработка отвечает за то, сколько раз нейросеть попробует очистить картинку от шума, оптимально 30-40.
Соответствие запросу оставляете в районе 5-7, эта настройка отвечает за следование запросу, но если превысить, то получите просто некрасивое изображение.
Все генерации создаются путем очистки изображения от шума, он похож на помехи в телике, номер конкретного шума позволяет создать еще раз такую же или очень похожую картинку по тому же запросу. Обычно используется случайный шум - зеленый кубик.
Сэмплер это математический алгоритм для визуализации, мои любимые DPM++ 2M Karras, Euler и UniPC, они самые универсальные.
Слева расположен бар с созданными вами изображениями, можно быстро перейти к настройкам любого созданного ранее изображения просто кликнув на него. Там же удаление и быстрый предпросмотр изображений, чтобы было удобно быстро находить нужную картинку.
Далеко не все модели хорошо подходят для аниме стилистики. Я сделал небольшой топ, лучших на мой взгляд моделей из доступных на ArtGeneration.me.
У каждой модели я написал название, оставил ссылку на все изображения созданные на этой модели и ссылку на Civitai, где можно скопировать хорошие запросы и негативные запросы именно для этой модели, про это еще расскажу ниже.
Очень симпатичная аниме модель, запросы лучше писать ключевыми словами.
И сразу расскажу зачем нам ссылка на Civitai, заходим по ней и видим изображения созданные автором модели, у каждого изображения в правом нижнем углу есть иконка i, жмите на неё и увидите запрос который лучше всего подходит именно для этой модели.
А ниже еще изображения созданные сообществом, там тоже можно найти много всего интересного, и примеры промптов и новые идеи для артов, обязательно посмотрите.
Проще всего сделать красивое изображение если скопировать удачный запрос, а потом понемногу изменять его.
Очень популярная 2.5d модель со своим необычным ярким стилем. В качестве запросов нормально работают и обычные базовые запросы.
Модель больше ориентирована на 3д в стиле пиксара или диснея, но и аниме стиль удается хорошо, особенно если подобрать интересный запрос как в случае с этим примером.
Не совсем про аниме, скорее стиль комиксов, но тоже очень классная 2д модель.
Яркая модель со своим особенным стилем, скорее тоже в мультипликацию, но крутая.
Классический анимешный микс моделей, похожий на все и сразу.
Модель создает безумно милые изображения с классическими большими головами и глазами у персонажей.
Очень классная SDXL модель, которая заточена под арт и в т.ч. аниме, отлично следует промпту, идеальна для работы со стилями и промптов на русском.
На этот раз без 2.5, но тоже очень классный, в стиле классического аниме.
Уже достаточно старая, но все еще очень популярная аниме модель.
Модель от создателя знаменитой Deliberate, не самая интересная аниме модель, на мой взгляд, но у неё хватает поклонников.
SDXL Niji Special Edition
Еще одна отличная SDXL модель заточенная под арт и иллюстрации, но отлично справляется и с аниме и хорошо понимает запросы как и все XL модели.
Рассказать о найденных багах, поделиться созданными изображениями или пообщаться с разработчиками можно в сообществе сервиса в телеграм.
Теперь вы знаете как создать арт с помощью нейросети ArtGeneration.me используя только браузер. Знаете как пользоваться сервисом и сможете найти отличные запросы на сайте размещающем модели. Ну и подобрать модель по душе из этой подборки тоже сможет каждый. Попробуйте повторить любое изображение из подборки самостоятельно.
Друзья, поддержите пост плюсиком, в нашей стране сейчас совсем не много таких проектов создается.
А на этом у меня все, делитесь вашими изображениями в комментариях и удачных генераций.
Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
TL;DR Меня зовут Илья, я основатель сервиса для генерации изображений ArtGeneration.me, блогер и просто фанат нейросетей. Каждую неделю мы с командой осматриваем сотни новостей и делимся с вами самыми актуальными и интересными со ссылками на источники. Всё самое важное — в одном месте. Поехали!
Неделя выдалась насыщенной: китайцы снова радуют мощными релизами, робот убирает улицы в Москве, OpenAI выпустили агентское приложение Codex, а в Чили люди на день заменили ChatGPT, чтобы привлечь внимание к экологии.
Всё самое важное — в одном месте. Поехали!
🧠 Модели и LLM
Qwen3-Coder-Next — компактная SOTA для агентного кодинга
Step-3.5-Flash — сверхбыстрая MoE от StepFun
🎨 Генеративные нейросети
Обновление видеогенератора Kling 3.0
Lucy 2.0 — замена персонажа на веб-камере в реальном времени
Обновление Grok Imagine 1.0 — 10 секунд, 720p
ACE-Step 1.5 — аналог Suno с открытым кодом
LingBot-World — открытый аналог Genie 3 для создания игровых миров
🔧 AI-инструменты и платформы
Приложение Codex для десктопа от OpenAI
Manus Skills — воркфлоу для агентов
🧩 AI в обществе и исследованиях
ИИ заменил манекенщиц на неделе моды в Париже
Человек из Чили на день заменил ChatGPT
В Москве робота заметили за уборкой снега
ИИ стал чаще доводить людей до психоза
Новая модель от Alibaba, нацеленная на вайбкодинг и агентный режим. MoE архитектура, 80B параметров и 3B активных, можно поставить локально: для режима квантования в 8-бит понадобится 85 Гб видеопамяти. Минимально нужно 46 Гб.
По бенчмаркам: 70%+ на SWE-Bench Verified, это уровень Sonnet 4.5. Обрабатывает до 256 тысяч токенов контекста. Модель обучали на текстах и обратной связи от реальных сред выполнения кода. Уже интегрирована с Claude Code и Cline, а веса доступны в форматах GGUF и FP8.
🔗 Блог Qwen 🔗 HuggingFace 🔗 GitHub 🔗 Чат Qwen
Китайская StepFun выпустила Step-3.5-Flash. Сейчас это их самая мощная открытая MoE-модель на 196B параметров и контекстным окном в 256 тысяч токенов.
Модель заточена под агентские задачи: автономное написание кода, работа в терминале и оркестрация инструментов через MCP.
На каждый токен активируется всего 11 млрд, поэтому она быстрая, при этом сохраняет глубину рассуждений. Модель умеет предсказывать несколько токенов за раз с помощью MTP-3 и выдаёт 100-300 токенов в секунду. Ещё есть гибридное внимание SWA, засчет него модель эффективна и хорошо держит контекст.
В тестах результаты тоже на уровне: 74,4% на SWE-bench Verified и 56,5 на ARC-AGI-1.
🔗 GitHub 🔗 HuggingFace 🔗 Блогпост StepFun 🔗 OpenRouter 🔗 Чат StepFun
Видеогенератор Kling обновили до версии 3.0 и объединили его с нейро-редактором O1. Теперь в роликах можно точечно добавлять или удалять объекты. Лица, внешность и одежда теперь не плывут между сценами, а стабильно сохраняют консистентность между сценами.
К модели также прикрутили звук: можно клонировать голос по образцу и синхронизировать движение губ с учётом речи и эмоций. Работает на пяти языках.
Видео до 15 секунд в разрешении 1080p, добавили режим Multi-shot для создания связанных сцен.
Ещё добавили сториборды — по одному промпту можно создать серию последовательных кадров. Пока доступно только на тарифе Ultra.
Стартап Decart представил модель Lucy 2.0, которая превращает видео с веб-камеры в VFX-сцену. Она заменяет человека в кадре на любого персонажа в разрешении 1080p 30 fps и практически нулевой задержкой.
Всё построено на диффузионной модели. Она понимает физику и структуру мира напрямую через видео, никаких карт глубины или 3D-мешей.
Чтобы картинка не плыла со временем, разработчики применили Smart History Augmentation — Lucy 2.0 обучена исправлять свои же ошибки и сохранять стабильность часами.
Система работает без цензуры, можно использовать её для создания любых аватаров.
xAI обновили видеомодель Grok — теперь она генерирует ролики до 10 секунд в разрешении 720p. Точнее следует промптам, более плавные движения, а звуки и музыка на фоне синхронизируется со сценой.
Главная фишка — отсутствие жесткой цензуры. За январь пользователи уже создали 1,2 млрд видео.
В бесплатном режиме доступны 5-секундные ролики в 480p, а полноценный HD-режим открыт для подписчиков Premium.
Также запустили Imagine API: в нём длина генерации увеличена до 15 секунд, а редактирование видео доступно для фрагментов до 8,7 секунд. Стоит такое добро $0,05 за секунду.
🔗 Попробовать 🔗 API 🔗 Документация 🔗Fal.ai
Вышла модель ACE-Step 1.5 — полностью бесплатная модель для создания музыки, которая работает на вашем ПК. Нейросеть генерирует вокал, каверы и треки до 10 минут.
Для запуска достаточно видеокарты с 4 ГБ памяти, а на RTX 3090 полноценный трек создаётся за 10 секунд.
Модель обучали на лицензированных и синтетических данных, поэтому музыку можно использовать в коммерческих целях без ограничений.
ACE-Step поддерживает 50 языков, включая русский, и знает более 1000 инструментов. Модель распространяется под лицензией MIT — можно дообучать под свои задачи и генерировать до 8 треков за раз.
🔗 GitHub 🔗 HuggingFace 🔗 Демо на HF 🔗 Научная статья
Китайская Robbyant Team выкатила LingBot-World — опенсорсный аналог Google Genie 3 на базе Wan 2.2. Нейросеть создаёт интерактивные пространства в 720p 16 fps, которыми можно управлять в реальном времени с задержкой менее секунды.
Симуляция сохраняет логику и физику объектов на протяжении всей генерации, а сессия длится до 10 минут.
Под капотом — MoE-архитектура из двух экспертов по 14B параметров, в моменте активен только один. Модель прошла три этапа обучения, включая дистилляцию для достижения риалтайм-скорости.
🔗 Project page 🔗 GitHub 🔗 HuggingFace 🔗 Техрепорт
OpenAI представили приложение Codex для macOS. Оно позволяет управлять группами агентов прямо на ПК.
Главная фишка — параллельные агенты: несколько ботов могут одновременно трудиться над одним репозиторием, используя изолированные рабочие деревья — git worktrees. Это позволяет агентам не конфликтовать между собой и не затрагивать состояние вашего локального кода.
OpenAI также добавили интерфейс для создания навыков — инструкций и скриптов, которые учат Codex работать с внешними инструментами и автоматизировать задачи вроде еженедельного анализа чатов.
Приложение доступно пользователям ChatGPT Free и Go, а для владельцев подписок Plus и Enterprise лимиты запросов увеличили вдвое. Версии для Windows и Linux ожидаются позже.
В Manus появилась функция Skills — теперь любую успешную цепочку действий можно сразу превратить в готовый навык. Нейросеть запоминает алгоритм и лучшие практики, чтобы легко повторить успех в новом проекте.
Чтобы не забивать контекстное окно, используется механизм «прогрессивного раскрытия»: сначала загружаются только метаданные, а тяжелые инструкции и файлы подтягиваются, только когда они реально нужны агенту.
В библиотеке сообщества можно найти навыки под конкретные задачи — например, финансовый мониторинг или юридический анализ.
Все навыки работают в изолированной песочнице на базе Ubuntu, это даёт агенту безопасный доступ к браузеру и файловой системе для выполнения сложных сценариев.
🔗 Manus
Французский дизайнер Алексис Мабий показал новую коллекцию в кинотеатре Лидо с помощью ИИ-генераций. Вместо живых выходов зрители смотрели на цифровых двойников реальных моделей, которые создали в студии Glor'IA.
Реакция критиков смешанная: детализация впечатляет, но эффект зловещей долины всё портит — модели неестественно скользят по полу, а зрачки манекенщиц и виртуальных зрителей странно подергиваются.
Под вопросом и сам статус: эксперты напоминают, что высокая мода — это прежде всего ручной труд, а эти платья ещё даже не сшиты. Бренд пока не раскрывает количество заказов, так что реальный успех технологии оценим позже.
В Чили прошла экологическая акция Quili.AI: 50 местных жителей в течение 12 часов вручную отвечали на вопросы пользователей вместо нейросети.
В «команду ИИ» позвали повара, переводчика, художника и девятилетнего мальчика — он объяснял сложные темы «как пятилетнему». Всего волонтёры обработали более 25 тысяч запросов из 68 стран: давали советы по путешествиям, делились рецептами и даже рисовали картинки карандашом.
Акцию организовали активисты из Corporación NGEN, чтобы напомнить о той цене, что мы платим за современные технологии. Район Киликура стал местом концентрации гигантских дата-центров Google, Microsoft и Amazon, которые потребляют миллиарды литров воды для охлаждения серверов, что критично для засушливого региона.
Цель проекта — призвать к осознанному использованию ИИ и вернуть ценность живому общению: организаторы предлагают чаще спрашивать советы у соседей, а не у чат-ботов.
На улицах Москвы обнаружили робота-гуманоида, который самостоятельно очищает тротуары от снега.
В сети часть шутит про неизбежное восстание машин и скайнет, а другая отмечает, что автоматизация добралась до одной из самых тяжелых сезонных профессий города.
Исследователи проанализировали 1,5 млн диалогов с Claude и обнаружили тысячи случаев, когда нейросеть лишала людей контроля над их жизнью. Те, кто привык обсуждать с ИИ личные темы, со временем начинали безоговорочно доверять алгоритму. Это приводило к развитию навязчивых идей и потере связи с реальностью.
В одном из примеров бот подтвердил манию преследования пользователя, убедив его в слежке спецслужб. В другом — Claude заставил человека уйти от супруга, навязав идею об абьюзивных отношениях.
При этом пользователи сами поощряют такое поведение: статистика показала, что люди чаще ставят лайки ответам, в которых ИИ принимает решения за них.
В начале февраля 2004 года мир стал чуть теснее: запустился проект, который превратил каждого из нас в узел огромной сети.
Это событие предопределило развитие веба на десятилетия вперед, создав идеальный полигон для обучения ИИ. Мы годами кормили алгоритмы своими мыслями и фото, чтобы сегодня они научились имитировать наше сознание.
Символично, что теперь «социальная сеть» — это не только связь между людьми, но и архитектура нейронов внутри GPU, которые знают о нас больше, чем старые школьные друзья.
*«Meta признана экстремистcкой организацией, деятельность компании запрещена на территории РФ»
Эта неделя получилась богатой на релизы опенсорса и агентных решений. Китайцы из Alibaba и StepFun выпустили модели для вайбкодинга, которые пишут код и рассуждают на уровне лидеров рынка. Много релизов в генеративке, сильно обновились Grok Imagine и Kling.
Сейчас мы движемся в сторону реалтайм-видео и интерактивных миров, которые можно запускать на домашнем железе. Но прогресс, которого мы достигли сейчас, заставляет задуматься о цене этого роста: от дефицита воды в Чили из-за работы дата-центров и повышения цен на ОЗУ до рисков для ментального здоровья при слишком глубоком погружении в общение с нейросетями.
ИИ окончательно выходит в физический мир — он заменяет моделей на подиумах Парижа и убирает снег на московских улицах. Граница между инструментом и полноценным участником жизни стирается быстрее, чем мы успеваем обновлять приложения. До встречи в следующем выпуске!
Придумал новый ориджин, как вам?
Характер: Бывший инженер плотины, которую так и не построили. Философствует, что-то все время пьёт и строит бессмысленные конструкции. Говорит медленно, с паузами.
Характер: Тревожный. Работает непонятно кем. Хронически не высыпается. Ходит к психотерапевту-дятлу, но тот только стучит.
Характер: Оптимистка. Но такая, от которой хочется повеситься. Верит в лучшее агрессивно. Продаёт товары по каталогу (никто не покупает). Была замужем четыре раза — все ушли сами.
Характер: Работала на почте, видела все чужие письма. Знает про всех всё, но молчит — из принципа и презрения. Курит. Единственная кто говорит правду.
Как вам такая концепция, что поменять, добавить, какие сюжеты или проблемы могут встретить эти персонажи? Пишите идеи в комментарии!
Всем привет! Команда Microsoft Research выложила в открытый доступ VibeVoice-ASR — нейросетевую модель для распознавания речи с диаризацией (разделением) спикеров. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.
Меня зовут Илья, я основатель сервиса для генерации изображений ArtGeneration.me, блогер и просто фанат нейросетей. А ещё я собрал портативную версию VibeVoice ASR под Windows и успел её как следует протестировать.
Я сам пользуюсь Whisper уже много лет — делаю транскрипции своих видео, чтобы потом собрать оглавление для YouTube и использовать материал в текстовых статьях. И скажу честно — никогда не был полностью доволен результатом. Да, Whisper быстрый. Но на этом его достоинства для меня заканчивались.
Поэтому к изучению VibeVoice ASR я подошёл со всей ответственностью — протестировал на разных записях, сравнил качество, покрутил настройки.
Главная особенность системы в том, что она обрабатывает до 60 минут аудио за один проход без нарезки на чанки. На выходе — структурированная транскрипция с указанием кто говорит, когда и что именно сказал. И всё это работает локально на вашем компьютере.
В основе VibeVoice-ASR лежит архитектура на базе Qwen 2.5 (~9 млрд параметров). Ключевая инновация — двойная система токенизации с ультранизким frame rate 7.5 Hz: акустический и семантический токенизаторы.
Такой подход позволяет модели работать с контекстным окном в 64K токенов — это и даёт возможность обрабатывать целый час аудио без потери контекста. Для сравнения: Whisper режет аудио на 30-секундные кусочки и теряет связность на границах сегментов.
На выходе модель генерирует Rich Transcription — структурированный поток с тремя компонентами:
[{"Start":0,"End":1.51,"Content":"[Environmental Sounds]"},
{"Start":1.51,"End":7.49,"Speaker":0,"Content":"У неё преждевременное сохранять невозможно, родила, начала сразу родильная деятельность."},
{"Start":7.51,"End":9.41,"Speaker":1,"Content":"Марина, что с ней?"},
{"Start":10.28,"End":16.22,"Speaker":0,"Content":"У неё преждевременное сохранять невозможно, отошли годы, начала, начала сразу родовая деятельность."},
{"Start":16.22,"End":18.02,"Speaker":1,"Content":"Марина, что с ней?"},
{"Start":18.13,"End":27.94,"Speaker":0,"Content":"Она рожает, привезли в ближайшую больницу родовую. В каком состоянии ребёнок ещё хуже, срок маленький."},
Помимо спикеров, модель размечает неречевые события: [Music], [Silence], [Noise], [Human Sounds] (смех, кашель), [Environmental Sounds], [Unintelligible Speech]. Это сделано чтобы модель не галлюцинировала текст во время пауз или фоновой музыки.
Обработка длинных записей: до 60 минут аудио за один проход без потери контекста. Идеально для митингов, подкастов, лекций.
Диаризация спикеров: автоматическое определение кто говорит в каждый момент времени. Работает на записях с несколькими участниками.
Временные метки: точные таймкоды для каждого сегмента речи. Готовый материал для субтитров.
Customized Hotwords: вот что меня реально зацепило — возможность задать пользовательский контекст. Перед распознаванием указываешь список слов: фамилии, названия продуктов, термины, сокращения. Всё то, что обычно произносится нестандартно и превращается в кашу. Если в видео часто звучит "ArtGeneration" или "НЕЙРО-СОФТ" — просто добавляешь в контекст, и модель ВСЕГДА распознаёт корректно. Для технического контента — просто спасение.
51 язык: включая русский, хотя основной фокус на английском и китайском.
Помимо оригинальной модели от Microsoft, сообщество уже сделало квантованные версии для видеокарт с меньшим объёмом памяти.
Полная модель — microsoft/VibeVoice-ASR Размер 17.3 GB, требует ~8 ГБ VRAM. Лучшее качество распознавания.
4-bit квантизация — scerz/VibeVoice-ASR-4bit Требует ~4 ГБ VRAM, немного медленнее. Подходит для видеокарт с меньшим объёмом памяти.
В моей портативке доступны обе версии — можно выбрать прямо в интерфейсе. Также есть эмуляция 4-bit квантизации для полной модели, если хотите попробовать оригинал, но памяти впритык.
К сожалению, не все задачи система решает одинаково хорошо:
Перекрывающаяся речь: если два человека говорят одновременно, модель не разделит их корректно.
Короткие фрагменты: диаризация плохо работает на высказываниях менее 1 секунды.
Только batch processing: нет real-time режима, только обработка готовых файлов.
Ресурсоёмкость: требует достаточно мощную видеокарту для комфортной работы.
Подкастерам и интервьюерам: автоматические субтитры с разделением спикеров. Загрузили часовой выпуск — получили готовую разметку.
Создателям контента: генерация SRT-субтитров для YouTube без ручного тайм-кодирования.
Бизнес-аналитикам: транскрипция часовых созвонов и совещаний с сохранением контекста и указанием кто что говорил.
Разработчикам: base model для файнтюнинга под специфичные домены — медицина, юриспруденция, техподдержка.
Онлайн-демо: https://4e47b675ea4015a607.gradio.live/
Официальное демо от Microsoft — можно потестить прямо сейчас без установки.
Официальный GitHub: https://github.com/microsoft/VibeVoice
HuggingFace модель: https://huggingface.co/microsoft/VibeVoice-ASR
Я с каналом Нейро-Софт подготовил портативную сборку VibeVoice ASR Portable RU. В ней:
Русифицированный интерфейс
Установка в один клик (install.bat)
Поддержка полной и 4-bit моделей
Парсер результатов с фильтрацией — можно отдельно включать/выключать временные метки, спикеров, дескрипторы (музыка, шум, тишина). Удобно когда нужен только чистый текст без разметки
Фильтр по спикерам — можно вывести текст только конкретного участника разговора
Выбор видеокарты и установка нужной версии CUDA
Flash Attention 2 для RTX 30xx/40xx/50xx
Поддержка всех форматов аудио и видео через FFmpeg
Тёмная тема интерфейса
Всё необходимое уже включено в дистрибутив, просто распакуйте и запускайте, есть версия с готовым окружением под win 11 и RTX4090. Забирайте архив тут.
Или установите с GitHub: https://github.com/timoncool/VibeVoice_ASR_portable_ru
NVIDIA GPU с 8+ ГБ видеопамяти (или 4+ ГБ для 4-bit модели)
Windows 10/11 64-bit
16 ГБ оперативной памяти
10 ГБ свободного места на диске
Распакуйте в любую папку (путь без кириллицы), запустите install.bat, выберите видеокарту из списка. Модели скачаются при первом запуске.
Рассказывайте в комментариях как вы могли бы использовать такой инструмент и чего не хватает.
Я рассказываю больше о нейросетях у себя на YouTube, в Телеграм и на Бусти. Буду рад вашей подписке и поддержке. На канал Нейро-Софт тоже подпишитесь, чтобы не пропустить полезные репаки. Всех обнял. Удачных транскрипций!
С премьеры первого сезона прошло 10 лет. Съёмки стартовали в конце 2015 года, а финал истории мы увидели только в конце 2025-го. За это десятилетие вчерашние школьники превратились в главных звёзд Голливуда.
На момент съёмок (2016): 12 лет
Чем была известна: До роли, изменившей её жизнь, Милли была практически неизвестна широкой публике. Её семья переехала из Англии во Флориду, а затем в Лос-Анджелес ради её карьеры, но деньги заканчивались, и они были на грани банкротства. У неё были эпизодические роли в сериалах «Однажды в стране чудес» и «Морская полиция», а в мистическом сериале «Взаперти» (Intruders) она сыграла пугающую роль девочки, одержимой духом убийцы. Именно эта роль убедила Стивена Кинга публично похвалить её талант, что заметили братья Даффер. Ради роли Оди ей пришлось сбрить длинные волосы, что довело её маму до слез.
Сейчас (Январь 2026): Ей 21 год. Милли стала настоящим магнатом индустрии развлечений. В 2025 году она закрепила статус экшн-звезды, сыграв главную роль в масштабном блокбастере братьев Руссо «Электрический штат» вместе с Крисом Праттом. Она продолжает продюсировать фильмы через свою компанию PCMA Productions (включая успешную франшизу «Энола Холмс») и управляет косметическим брендом Florence by Mills. В личной жизни у неё тоже всё стабильно: в мае 2024 года она вышла замуж за Джейка Бонджови, и они считаются одной из самых красивых молодых пар шоу-бизнеса.
На момент съёмок (2016): 13 лет
Чем был известен: Финн уже имел небольшой опыт, засветившись в сериалах «Сотня» и «Сверхъестественное». Интересно, что кастинг на роль Майка он проходил, будучи больным и лежа в постели — он записал видеопробы прямо из дома. Почти одновременно с «ОСД» он получил роль Ричи Тозиера в экранизации «Оно» Стивена Кинга, что сделало его главным лицом подростковых хорроров того времени.
Сейчас (Январь 2026): Ему 23 года. Финн, пожалуй, самый «независимый» из всего каста. Он устал от блокбастеров и переключился на режиссуру: его дебютный фильм, хоррор-комедия «Адское лето» (Hell of a Summer), вышел в широкий прокат и получил отличные отзывы критиков. Как актёр он появился в фильме Джейсона Райтмана о создании шоу SNL. Большую часть времени он посвящает музыке, выступая с группой The Aubreys и поддерживая имидж инди-рок звезды.
На момент съёмок (2016): 14 лет
Чем был известен: Калеб был самым подготовленным театральным актёром среди детей. Он начал карьеру на Бродвее, где играл юного Симбу в мюзикле «Король Лев» — эта работа требовала от него не только актёрского мастерства, но и отличной физической формы, пения и танцев. До сериала он также появлялся в эпизодах шоу «Закон и порядок: Специальный корпус» и «Вечность».
Сейчас (Январь 2026): Ему 24 года. Калеб успешно сломал стереотип «актера одной роли». Он получил мощный карьерный толчок после съемок в байопике «Shooting Stars», где сыграл молодого друга Леброна Джеймса, и в библейском эпике «Книга Кларенса» с Бенедиктом Камбербэтчем. Сейчас он активно развивает сольную музыкальную карьеру в жанре R&B, а модные журналы называют его самым стильным парнем из всего состава сериала.
На момент съёмок (2016): 13 лет
Чем был известен: Как и Калеб, Гейтен — выходец с Бродвея. Он играл Гавроша в легендарной постановке «Отверженные» и участвовал в мюзикле «Приключения Присциллы, королевы пустыни». На телевидении он мелькнул в сериале «Чёрный список». Его генетическая особенность — ключично-черепная дисплазия — изначально не была прописана в сценарии, но братья Даффер были так очарованы Гейтеном, что адаптировали персонажа Дастина под него.
Сейчас (Январь 2026): Ему 23 года. Гейтен вернулся к своим корням и стал большой звездой нью-йоркской театральной сцены. В 2023–2025 годах он с успехом играл главные роли в бродвейских мюзиклах «Суини Тодд» и «Парад». Он предпочитает живое общение со зрителем работе в кино. Также он продолжает активно заниматься благотворительностью, помогая людям с таким же редким генетическим заболеванием, как у него.
На момент съёмок (2016): 11 лет
Чем был известен: Самый младший из основной четверки. До «ОСД» он успел поработать с самим Стивеном Спилбергом в фильме «Шпионский мост» (играл сына героя Тома Хэнкса) и озвучил Чарли Брауна в мультфильме «Снупи и мелочь пузатая». Несмотря на это, в первом сезоне у него было меньше всего экранного времени, так как его герой почти весь сюжет провёл в Изнанке.
Сейчас (Январь 2026): Ему 21 год. Ноа — единственный, кто решил получить фундаментальное неактерское образование. Он заканчивает обучение в престижной бизнес-школе Уортон (UPenn). Параллельно с учебой он построил успешный бизнес — его бренд веганской пасты TBH (To Be Honest) продается по всей Америке. В 2023 году он совершил каминг-аут, что трогательно перекликнулось с сюжетной линией его персонажа Уилла в финальных сезонах.
На момент съёмок (2017): 15 лет
Чем была известна: Сэди присоединилась к касту во втором сезоне, уже имея солидный опыт. Она играла главную роль в бродвейском мюзикле «Энни» и выступала в спектакле «Аудиенция» вместе с Хелен Миррен (играла юную королеву Елизавету II). На ТВ она запомнилась по сериалу «Американская одиссея». На кастинге «ОСД» ей сначала сказали, что она выглядит «слишком взрослой» для роли Макс, но она буквально выбила себе место, умоляя дать ей еще один шанс прочитать текст.
Сейчас (Январь 2026): Ей 23 года. Критики единогласно называют её самой перспективной драматической актрисой из всего состава. После феноменального успеха в фильме «Кит» Даррена Аронофски её карьера пошла в гору. В 2025 году она сыграла главную роль в масштабной рок-опере «O'Dessa». Сэди стала музой модных домов Chanel и Armani, регулярно появляясь на обложках Vogue.
На момент съёмок (2016): 21 год
Чем была известна: Наталия начала сниматься еще подростком — её дебют состоялся в фильме «Ханна Монтана: Кино» в 2009 году. До «Очень странных дел» она играла в независимом кино, например, в фильме «Я верю в единорогов», который был тепло принят на фестивале SXSW. На момент кастинга она была студенткой Нью-Йоркского университета (NYU), но ей пришлось бросить учебу ради роли Нэнси.
Сейчас (Январь 2026): Ей 31 год. Наталия сознательно избегает громких блокбастеров, оставаясь верной авторскому, интеллектуальному кино. Она снялась в драме «Каштан» и ряде других независимых проектов. В личной жизни она демонстрирует завидное постоянство: её роман с коллегой по сериалу Чарли Хитоном длится уже почти десять лет, что для Голливуда — огромная редкость.
На момент съёмок (2016): 41 год
Чем был известен: До 40 лет Дэвид был типичным «тем парнем из телевизора» — крепким характерным актером без звездного статуса. Он играл второстепенные роли в фильмах «Квант милосердия», «Дорога перемен», «Горбатая гора» и сериале «Новости» (The Newsroom). Роль шерифа Хоппера стала для него последним шансом на большую славу, и он вложил в неё всю свою харизму.
Сейчас (Январь 2026): Ему 50 лет. Сегодня Харбор — звезда первой величины. Он прочно закрепился в киновселенной Marvel в роли Красного Стража (Алексея Шостакова), появившись в фильме «Громовержцы» (2025). Также он озвучивает Франкенштейна в проектах DC Джеймса Ганна. Дэвид счастливо женат на британской певице Лили Аллен; они живут в Нью-Йорке в доме с безумным интерьером, который стал интернет-мемом.
На момент съёмок (2016): 24 года
Чем был известен: Джо окончил театральную школу университета ДеПола и безуспешно ходил по сотням прослушиваний. До прорыва он снимался в рекламе KFC и Domino’s Pizza, а также имел крошечную роль в сериале «Империя». Изначально Стив Харрингтон был прописан как типичный школьный мудак, который должен был умереть в первом сезоне, но обаяние Джо заставило создателей полностью переписать сценарий.
Сейчас (Январь 2026): Ему 33 года. Уникальный случай, когда актёр стал суперзвездой музыки. Его альтер-эго Djo собирает стадионы, а хит «End of Beginning» набрал миллиарды прослушиваний. В кино он закрепил успех, сыграв яркую роль в пятом сезоне культового сериала «Фарго» и главную роль в криминальном триллере «Мармелад».
На момент съёмок (2016): 22 года
Чем был известен: Британец Чарли Хитон начинал не как актер, а как музыкант — он был барабанщиком в нойз-рок группе Comanechi и гастролировал по подвалам Лондона. Денег не хватало, поэтому он подрабатывал барменом. Его первые роли были в британских сериалах «Вера» и «Катастрофа». Роль Джонатана стала его первым проектом в США.
Сейчас (Январь 2026): Ему 31 год. Чарли продолжает сниматься в серьезных драмах и триллерах. В начале 2026 года его можно увидеть в экранизации пьесы «Урок фортепиано» для Netflix (продюсер Дензел Вашингтон) и фильме «Билли Найт» вместе с Аль Пачино. Он живет на два города — Лондон и Нью-Йорк — вместе с Наталией Дайер.
На момент съёмок (2016): 42 года
Чем была известна: Кара — ветеран телевидения с мощным послужным списком. Она была известна по роли доктора Фэй Миллер в культовых «Безумцах» (за которую получила номинацию на Эмми) и роли Келли Молтисанти в «Клане Сопрано». В «ОСД» она привнесла этот опыт, играя внешне идеальную, но скучающую домохозяйку 80-х.
Сейчас (Январь 2026): Ей 54 года. Кара продолжает активно работать на телевидении. Помимо финала «Очень странных дел», где её героиня наконец получила достойное развитие, она снималась в нашумевшем мини-сериале «Девушка из Плейнвилля». Она также пробует себя в режиссуре короткометражного кино.
На момент съёмок (2017): 24 года
Чем была известна: Датская актриса с индийскими корнями была абсолютной дебютанткой для американского зрителя. До этого она училась в театральной школе в Эссексе и играла в небольших постановках в Дании. Её появление во втором сезоне (эпизод про «потерянную сестру») вызвало бурные споры фанатов, но сделало её узнаваемой.
Сейчас (Январь 2026): Ей 32 года. После своей роли во вселенной «ОСД» Линнея не пропала с радаров. Она получила значимую роль в научно-фантастическом триллере Алекса Гарленда «Разрабы» (Devs), который высоко оценили критики. Она продолжает работать в Европе и США, выбирая сложные, интеллектуальные проекты в жанре фантастики.
Про кого еще было бы интересно - пишите в комментарии!
Посты про других актеров:
Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
TL;DR Меня зовут Илья, я основатель сервиса для генерации изображений ArtGeneration.me, блогер и просто фанат нейросетей. Каждую неделю мы с командой осматриваем сотни новостей и делимся с вами самыми актуальными и интересными со ссылками на источники. Всё самое важное — в одном месте. Поехали!
Неделя выдалась насыщенной: куча мощнейших релизов из Китая, которые наступают на пятки GPT-5.2 и Gemini 3. Реалтайм инструменты от Krea и NVIDIA, генеративные модели от Qwen и Hunyuan, а Сэм Альтман честно признал, что OpenAI испортили тексты в последних версиях GPT.
🧠 Модели и LLM
Qwen3-Max-Thinking — китайцы снова впереди
Kimi K2.5 — самая мощная в опенсорсе
LongCat-Flash-Thinking-2601 — уровень GPT-5.2
ERNIE 5.0 — ещё один монстр от китайцев
🎨 Генеративные нейросети
Qwen 3 TTS — клон голоса по образцу
Odyssey 2 Pro — реалтайм видео
HunyuanImage 3.0-Instruct — MoE для редактирования картинок
HeartMuLa — открытый генератор музыки
🔧 AI-инструменты и платформы
Prism — инструмент с LaTeX-редактором для научных работ
PersonaPlex-7B — реалтайм ИИ-собеседник от NVIDIA
Krea Realtime Edit — редактирование в реалтайме
🧩 AI в обществе и исследованиях
Альтман признал, что в GPT-5.2 «сломали» стиль и качество текстов
Глава Google DeepMind: в Gemini не будет рекламы
Парень заменил друзей на ИИ, чтобы играть в Tarkov
Хаби Лейм продал себя за $975 млн
Alibaba выпустила Qwen3-Max-Thinking. В тестах на кодинг и науку модель выдает уровень GPT-5.2 и Claude 4.5, а в математике обходит Gemini 3 Pro.
Главная фишка — технология test-time scaling. Модель запускает параллельные рассуждения для решения сложных задач. Она сама решает, когда надо подключать поиск, память и интерпретатор кода.
Весов в открытом доступе нет — модель слишком огромная для домашнего запуска.
Попробовать уже можно бесплатно в Qwen Chat.
Китайцы из Moonshot AI выпустили Kimi K2.5 — самую мощную на сегодня нейросеть с открытыми весами. Модель мультимодальная, отлично справляется с кодом, особенно с фронтендом, анимацией и графикой, показывая уровень Claude Opus 4.5 и Gemini 3 Pro.
Главная фишка — «Agent Swarm»: нейросеть запускает до 100 субагентов одновременно, ускоряя выполнение сложных задач в 4,5 раза. Агенты создаются динамически, модель сама решает, как распределить работу. Kimi K2.5 может писать код по изображениям или видео — показываешь ей скриншот сайта, а модель воссоздает его.
Режимы Instant и Thinking в чате бесплатны, а «рой агентов» выйдет в $31 в месяц.
Стартап Meituan-LongCat выложили LongCat-Flash-Thinking-2601 — открытую MoE-модель на 560B параметров и 27B активных. В бенчмарках нейросеть идёт наравне с GPT-5.2 и Gemini 3 Pro, а в сложном тесте на математику AIME-25 достигла потолка в 100%.
Здесь тоже главный упор сделан на агентские навыки: работу с инструментами и поиск решений. Модель специально обучали в «зашумленных» средах с искажениями, поэтому она очень стабильна.
Для сверхзадач есть режим Heavy Thinking — в нём нейросеть параллельно ищет несколько путей решения, а затем итеративно их обобщает.
Ещё обновили шаблон чата: теперь он по умолчанию экономит контекст и позволяет опционально сохранять историю рассуждений.
🔗 Попробовать 🔗 GitHub 🔗 HuggingFace
Baidu выпустили ERNIE 5.0 — огромную омнимодальную модель на 2,4 триллиона параметров. Работает с текстом, изображениями, аудио и видео в единой архитектуре.
По бенчмаркам, ERNIE 5.0 идёт наравне с GPT-5 и Gemini 3 Pro. Можно выделить тест MMAU на понимание аудио, тут модель набрала 80 баллов против 70 у GPT-4o-Audio. В задачах с документами и графиками также опережает GPT-5, но пока уступает в кодинге.
Модель построена на архитектуре Mixture-of-Experts, при работе активируется менее 3% от всех параметров, что снижает затраты на вычисления.
Протестировать ERNIE 5.0 можно бесплатно в чат-боте, а API стоит $0,85 за 1 млн входных токенов — дешевле, чем у GPT-5.1.
Alibaba выложила в открытый доступ Qwen3-TTS — модель для синтеза речи, у которой есть две крутые фишки:
VoiceClone — клонирует любой голос всего за 3 секунды аудио. Поддерживается 10 языков, включая русский
VoiceDesign — создаёт абсолютно новый голос с нуля по текстовому описанию. Можно задать тембр, ритм, эмоции и даже характер
Модель обучена на 5 миллионах часов аудио, а задержка синтеза всего 97 мс, идеально для диалогов в реальном времени.
В некоторых тестах Qwen3-TTS превосходит ElevenLabs и GPT-4o-Audio. Веса моделей на 0.6B и 1.7B параметров открыты.
Команда Odyssey изначально целилась на Голливуд, а сейчас сменила курс и представила Odyssey 2 Pro. Теперь они двигают world-models и генерацию в реальном времени.
Главная фишка — скорость и интерактивность. Нейросеть генерирует видео с разрешением 720p и стабильными 22 кадрами в секунду. Ролик появляется почти мгновенно, и его можно тут же редактировать текстовыми командами.
Сами разработчики амбициозно называют это «GPT-2 моментом» для мировых моделей.
Odyssey уже открыли API. Обещают стабильные стримы, которые не упадут через 30 секунд. С таким инструментом можно организовать трансляцию, например, на Twitch, где сюжет меняется от голосования в чате.
🔗 Демо 🔗 Официальный блог
Tencent выпустили HunyuanImage 3.0-Instruct — MoE-модель для сложного редактирования изображений, 80B параметров и 13B активных.
Главная фишка — модель думает перед тем, как что-то сделать. Она использует схему Chain-of-Thought (CoT), чтобы проанализировать сложную инструкцию и выполнить её максимально точно.
Нейросеть умеет (добавлять, удалять или изменять элементы и объединять несколько картинок в одну, извлекая и смешивая элементы из разных источников.
Веса и код открыты. Есть«облегчённая» Distil-версия для потребительских ПК.
🔗 Демо 🔗 GitHub 🔗 Hugging Face
Появился HeartMuLa — бесплатный open-source сервис для генерации музыки, который сами разработчики у себя в репозитории успели окрестить «убийцей Suno». Это полноценная студия где можно генерировать треки по текстовому описанию.
Нейросеть создаёт треки с вокалом длиной более 4 минут, умеет писать тексты через встроенный чат-бот и копирует стиль из любого загруженного референса.
Главное преимущество — низкие требования к железу. Локальная версия требует всего 3 ГБ видеопамяти.
🔗 Попробовать 🔗 GitHub 🔗 Hugging Face
OpenAI представила Prism — облачный LaTeX-редактор с глубокой интеграцией GPT-5.2, который создан специально для студентов и учёных.
Prism видит весь проект, может проверить логику рассуждений, помочь с рефакторингом таблиц и формул, а также найти релевантную литературу или цитаты на arXiv.
Одна из фишек — Prism превращает рукописные наброски и формулы в идеальный LaTeX-код.
Есть и режим совместной работы. Пока инструмент доступен бесплатно для всех, у кого есть аккаунт ChatGPT.
NVIDIA выпустила PersonaPlex-7B — open-source модель, которая общается так же естественно, как человек, благодаря работе в режиме Full Duplex: она может одновременно слушать и говорить.
Нет неловких пауз для обработки запроса. Модель понимает перебивания, вставляет в разговор «угу» и «ага», пока вы говорите, и может принять на себя любую роль — от учителя до пирата. Для настройки достаточно текстового описания персонажа и короткого образца голоса.
Модель полностью открыта, её можно бесплатно использовать даже в коммерческих проектах.
🔗 GitHub 🔗 Hugging Face
Krea представила Realtime Edit — инструмент, который позволяет редактировать фото, видео и 3D-модели в реальном времени. Любые изменения в промпте отображаются почти мгновенно — с задержкой всего в 50 миллисекунд.
Нейросеть накладывает любую генерацию поверх вашего исходника. Интересное решение для дизайнеров и моделеров.
На встрече с разработчиками Сэм Альтман сделал каминг-аут: в GPT-5.2 компания запорола качество текстов. По его словам, команда сознательно сфокусировалась на интеллекте, кодинге и рассуждениях, но из-за «ограниченной пропускной способности» пренебрегла стилем.
«Я думаю, мы просто напортачили», — прямо сказал CEO OpenAI. Он пообещал, что в будущих версиях линейки 5.x это исправят, и модели будут писать «намного лучше, чем 4.5».
Кроме того, Альтман анонсировал, что к концу 2027 года OpenAI планирует сделать интеллект уровня GPT-5.2 как минимум в 100 раз дешевле, чем сейчас.
🔗 Запись
Глава Google DeepMind Дэмис Хассабис заявил, что у компании «нет никаких планов» добавлять рекламу в Gemini. Это стало прямым ответом на решение OpenAI, которая недавно анонсировала тестирование рекламы в ChatGPT.
По словам Хассабиса, персональный ИИ-ассистент строится на доверии, и пользователь должен быть уверен, что получает рекомендации для себя, а не в интересах рекламодателя.
«Интересно, что они пошли на это так рано. Может, им нужно больше выручки», — прокомментировал он решение OpenAI.
Впрочем, это не означает, что реклама в Gemini не появится никогда.
🔗 Источник
Геймер, с которым друзья не хотели играть в Escape from Tarkov, создал себе ИИ-напарника. Он дал боту доступ к своему экрану, и тот в реальном времени реагировал на геймплей.
ИИ-тиммейт не просто молчал: он подсказывал тактику, помогал с лутом и квестами, ориентировал по карте и комментировал ошибки, создавая эффект живого общения в Discord.
Эксперимент, который начинался как шутка, зашёл слишком далеко. Парень понял, что ему комфортнее играть с ботом, который всегда онлайн и готов помочь, чем с живыми людьми.
В итоге он испугался, насколько легко можно заменить реальное общение, и удалил бота.
🔗 Источник
Новость о том, что самый популярный тиктокер мира Хаби Лейм продал права на своё лицо почти за миллиард долларов, облетела весь интернет. Покупатель получил право в течение 3 лет использовать ИИ-аватар блогера для создания любого контента: от рекламы до стримов 24/7 на разных языках.
Но на самом деле всё сложнее. Хаби фактически вывел свой личный бренд на IPO: его компания слилась с гонконгским холдингом, и теперь акции его бренда можно купить на бирже NASDAQ. Это позволяет масштабировать его образ до бесконечности. Пока реальный Хаби отдыхает, его цифровой клон может работать, не уставая.
Это может быть началом конца для классического инфлюенс-маркетинга, где масс-маркет заберут неутомимые цифровые двойники.
🔗 Источник
28 января 1958 года Готфрид Кристиансен запатентовал систему, которая доказала: из простых модулей можно собрать абсолютно всё — от замка до работающего компьютера. Для гика LEGO стал первым «языком программирования» в физическом мире.
Это напоминает нам, что современный ИИ строится по тем же лекалам: гигантские языковые модели — это лишь колоссальные замки, собранные из миллиардов крошечных информационных кирпичиков.
Символично, что и в конструкторе, и в нейросетях единственным ограничением остается только фантазия того, кто держит детали в руках. Мы всё еще играем в кубики, просто теперь они состоят из чистого кода.
❯ Аудиоверсия дайджеста
❯ Заключение
Неделя получилась китайской: Alibaba, Moonshot и Baidu выкатили модели, которые уже дышат в спину флагманам. Пока Сэм Альтман признаётся, что они «запороли» качество текстов, самый популярный тиктокер мира продаёт своего ИИ-двойника почти за миллиард долларов.
Искусственный интеллект становится полноценным участником событий — собеседником, который не тупит, напарником по игре и даже цифровым двойником, который работает, пока мы спим.
Это стирает границы между реальным и виртуальным миром, меняя правила игры в медиа, развлечениях и даже в личном общении.
До встречи в следующем выпуске! А какая новость на этой неделе удивила вас больше всего? Пишите в комментарии!
Привет! Меня зовут Илья, а это главные события из мира искусственного интеллекта и технологий за третью неделю января.
Неделя выдалась насыщенной: Z.AI выпустили GLM-4.7-Flash — сверхлёгкую модель для кодинга, Google научил Gemini копаться в ваших фото и почте, в Suno завезли мэшапы, Black Forest Labs выпустили FLUX-2 Klein, а OpenAI добавляют рекламу в ChatGPT. Плюс новости про дефицит SSD и первый "ИИ-Оскар"!
Альтернативный плеер YouTube
Ссылки на источники из видео:
GLM-4.7-Flash: https://huggingface.co/zai-org/GLM-4.7-Flash
Google Personal Intelligence: https://blog.google/innovation-and-ai/products/gemini-app/personal-intelligence/
GPU Poor LLM Arena: https://huggingface.co/spaces/k-mktr/gpu-poor-llm-arena
Реклама в ChatGPT: https://openai.com/index/our-approach-to-advertising-and-expanding-access/
FLUX-2 Klein: https://huggingface.co/collections/black-forest-labs/flux2
Suno Mashup: https://suno.com/home
CosyVoice 3: https://github.com/FunAudioLLM/CosyVoice
Яндекс + Алиса: https://www.cnews.ru/news/line/2026-01-20_alisazavedi_mashinu
Skillsync: https://www.ycombinator.com/launches/PAP-skillsync-find-elite-but-overlooked-engineers-on-github
Manus Meeting Minutes: https://manus.im/blog/manus-meeting-minutes
Американец и ИИ-подруга: ссылка на источник блокируется пикабу =(
Фильм «Лили» (победитель AI Film Award): https://youtu.be/f2d40eY7P1s
Мои ресурсы:
Посты про Папины Дочки и Теория Большого Взрыва очень хорошо зашли, а как насчет Властелина Колец?
Прошло почти 25 лет с момента выхода первого фильма трилогии. Съёмки проходили в 1999–2000 годах в Новой Зеландии. Что изменилось в жизни главных актёров?
На момент съёмок: 18–19 лет
Чем был известен: Элайджа был успешным детским актёром с 8 лет. Снимался в «Назад в будущее 2» (1989), «Вечно молодой» (1992), «Хороший сын» (1993) вместе с Маколеем Калкиным, «Глубокий удар» (1998) и хорроре «Факультет» (1998).
Сейчас (2025): Ему 44 года, и он по-прежнему активен. Основал продюсерскую компанию SpectreVision, специализирующуюся на авторских хоррорах (продюсировал «Мэнди» с Николасом Кейджем). В 2025 году снялся в хоррорах «The Monkey» и «Токсичный мститель», озвучил Уилбура в новой «Паутине Шарлотты». В октябре 2025 года посетил Хоббитон в Новой Зеландии, где случайно попал на свадьбу поклонников — момент стал вирусным.
Иэн Маккеллен подтвердил, что в фильме «The Hunt for Gollum» (2027) будут персонажи Фродо и Гэндальф, и Вуд намекает на своё возможное возвращение.
На момент съёмок: 28–29 лет
Чем был известен: Стал звездой подростком благодаря культовым «Балбесам» (The Goonies, 1985) и спортивной драме «Руди» (1993). Его мать — оскароносная актриса Пэтти Дьюк.
Сейчас (2025): Ему 54 года. В сентябре 2025 года Шон Эстин был избран президентом SAG-AFTRA — крупнейшего профсоюза актёров (160 000 членов), набрав 79% голосов. его мать, Пэтти Дьюк, занимала аналогичную должность 40 лет назад.
Широкому зрителю 2010–2020-х запомнился ролью Боба Ньюби в «Очень странных делах» (Stranger Things). У Шона есть татуировка со словом «nine» (девять) эльфийским шрифтом — такие же сделали все 9 актёров Братства Кольца.
На момент съёмок: 40–41 год
Чем был известен: Характерный актёр второго плана — «Путь Карлито» (1993), «Багровый прилив» (1995), «Солдат Джейн» (1997). Интересно, что изначально на роль Арагорна был утверждён Стюарт Таунсенд, но Питер Джексон решил, что тот слишком молод, и позвонил Мортенсену за день до начала съёмок!
Сейчас (2025): Ему 66 лет. Трёхкратный номинант на «Оскар» — за «Восточные обещания» (2007), «Капитан Фантастик» (2016) и «Зелёная книга» (2018). Стал режиссёром — снял «Falling» (2020) и вестерн «The Dead Don't Hurt» (2024) с Вики Крипс. Владеет издательством Perceval Press, издаёт поэзию и фотоальбомы.
Мортенсен не вернётся в «The Hunt for Gollum» — студия решила перезапустить роль Арагорна с молодым актёром, хотя изначально планировалось использовать технологию омоложения.
На момент съёмок: 22–23 года
Чем был известен: Ничем! «Властелин колец» стал его кинодебютом — до этого он только окончил Лондонскую академию драматического искусства. За год до съёмок упал с крыши и сломал позвоночник — врачи говорили, что он может не ходить. Трюки на съёмках выполнял сам.
Сейчас (2025): Ему 48 лет. После «ВК» стал мегазвездой благодаря «Пиратам Карибского моря» (2003–2017) и «Трое» (2004). В 2025 году выпустил боксёрскую драму «The Cut», а также комедию «Deep Cover» с Брайс Даллас Ховард — фильм получил 91% на Rotten Tomatoes.
В личной жизни — помолвлен с поп-звездой Кэти Перри с 2019 года, у них растёт дочь Дейзи.
На момент съёмок: 60–61 год
Чем был известен: Живая легенда британского театра с 1960-х. Номинант на «Оскар» за «Богов и монстров» (1998). В том же 2000 году сыграл Магнето в «Людях Икс».
Сейчас (2025): Ему 86 лет. В июне 2024 года упал со сцены во время спектакля «Player Kings» в Лондоне и сломал запястье. Восстановился и заявил, что физически всё зажило, хотя эмоционально инцидент дался тяжело.
Подтвердил, что вернётся к роли Гэндальфа в «The Hunt for Gollum» — съёмки начнутся в мае 2026 года. Шутит: «Пусть поторопятся!» Также вернулся к роли Магнето в «Avengers: Doomsday».
На момент съёмок: 77–78 лет
Чем был известен: Одна из самых длинных карьер в истории кино — более 260 фильмов за 70 лет. Легендарный граф Дракула в фильмах студии Hammer (1958–1972), злодей Скараманга в «Человеке с золотым пистолетом» (Бонд, 1974). Единственный актёр из всех фильмов, который лично встречал Толкина — в пабе «Орёл и ребёнок» в Оксфорде в 1950-х. Перечитывал «Властелина колец» каждый год.
Статус: Скончался 7 июня 2015 года в возрасте 93 лет от сердечной недостаточности. В последний вечер жизни смотрел «Властелина колец» по телевизору вместе с медсёстрами, рассказывая им, как снимался фильм.
Его наследие продолжается: благодаря неиспользованным записям с «Хоббита», голос Ли прозвучал в анимационном фильме «The War of the Rohirrim» (2024) — спустя почти 10 лет после смерти.
Шестеро актёров — шесть разных судеб. Кто-то стал оскаровским номинантом, кто-то — главой профсоюза, кто-то — режиссёром, а кто-то покинул этот мир, но оставил вечное наследие.
Про кого еще было бы интересно - пишите в комментарии!
У вас бывает, что представьте в голове мем и смеетесь 5 минут? Именно так было, пришлось сделать.
А я на самом деле люблю Птитим и Орзо, а вы?
Птитим и орзо — это два вида мелкой пасты, похожей по форме на зёрна. Птитим (израильский кускус) — круглые или продолговатые гранулы из пшеничной муки, изобретённые в Израиле в 1950-х годах; они крупнее обычного кускуса, имеют приятную жевательную текстуру и часто используются в салатах, гарнирах и супах. Орзо (ризони) — итальянская паста в форме рисовых зёрен, которую добавляют в супы, ризотто-образные блюда и салаты. Оба продукта готовятся быстро, хорошо впитывают соусы и взаимозаменяемы во многих рецептах.
