
Искусственный интеллект
Нейро Дудь
Осенью я давал интервью для документального фильма Высшей школы экономики "После промпта". В сам фильм попал небольшой фрагмент, и я долго думал что делать с остальным материалом. Так появился НейроДудь.
ВК версия
Если не считать монтажа самого интервью, работа над роликом заняла около трёх дней. Расскажу о ключевых этапах.
Визуал
Вначале нужно было сделать самого Дудя. Я сразу отказался от реалистичного варианта. Во-первых, это перебор, во-вторых, эффект зловещей долины был бы гораздо сильнее.
И это оказалось сложнее, чем я планировал. Потому что надо было решать сразу три задачи:
Дизайн локации должен хорошо монтироваться с основной сценой
Нужно было придумать дизайн самого робота
Робот должен быть похож на Дудя
Первые варианты выглядели как-то так:
Для генерации я использовал Nano Banana Pro. Попробовал разные нейросетки, но остановился на ней, так как детали нужно было дорабатывать итерациями. На работу с деталями способен и ChatGPT, но результат получался хуже.
Однако, я использовал ChatGPT, чтобы дорабатывать промт для Nano Banana. Без этого у меня получался то лысый краш-тестер:
То наш с Дудём внебрачный сын с голым животом и коленками:
Который в какой-то момент решил ещё и раздеться:
Спустя сутки мучений появился вариант, который меня более-менее устроил:
Осталось доработать окружение, цветокоррекцию и добавить привычную одежду:
Ещё я пытался сделать ему фирменные скрещенные ноги, но после нескольких часов попыток, решил, что лучшее - враг хорошего, и такой Дудь нам не нужен:
Следующим бастином было лицо. Мне не нравился текущий дизайн и я пустился в эксперименты:
Вот этот вариант мне нравился фирменной ухмылкой:
Но почему я от него отказался вы поймёте, когда дойдём до анимации. В конечном итоге, в финальный ролик попала доработанная версия одного из первых вариантов:
Достаточно похож, достаточно отличается, выглядит как следователь на допросе. В общем, то что нужно, чтобы пугать детей.
Синтез голоса
Этот этап был одновременно сложным и простым.
Простым, потому что Elevenlabs позволяет быстро и достаточно точно синтезировать голос. Там же можно расставить необходимые паузы и акценты. Получается как-то так:
Чтобы получился такой результат, нужно собрать хороший референс - исходник реальной речи говорящего, и вот в этом была сложность.
Мне пришлось отсмотреть 4-часовое интервью Дудя и вырезать все моменты, где говорит он. Причём нужны были моменты, где он что-то спрашивает, у него тогда появляются характерные интонации.
И боже, как я устал. Классно его слушать фоном, когда чем-то занимаешься, но когда ты вынужден прям смотреть и искать моменты именно с Юрой, и смотреть прям на Юру - это отдельный вид пытки.
Вам наверняка интересно, сколько минут говорит сам Дудь в своих интервью. И вот вам бессмысленный факт, о котором никто не просил. Юра говорит примерно 40 минут в интервью, которое длится 4 часа. Не благодарите.
Анимация
И вот мы подошли к самому интересному. Чтобы сделать анимацию с липсинком, есть два подхода: простой и сложный.
Сложный выглядит так: вы берёте Runway и выбираете там режим "Act-Two". Дальше нужно снять себя на камеру в нужном ракурсе, сделать вид, что вы Юра Дудь, который задаёт вопросы. Дальше в Premiere подставить вместо своего голоса, голос Дудя, так чтобы он совпадал с губами. И скормить это видео Runway вместе с референсной картинкой, которую мы подготовили на предыдущем шаге.
Тогда генерация была бы классной, НейроДудь активно бы двигался, а его губы хорошо попадали в текст. Но я понял, что так заморачиваться не готов. Сразу было понятно, что этот ролик на грани корректности.
Сомнительная история, с точки зрения авторских прав, да и сам Ютуб легко бы мог его снести по просьбе Юры. (Юра, пожалуйста не кидай страйк). Прикольный эксперимент, но на постоянной основе точно так делать не стоит.
Поэтому я решил пойти по простому пути. Для этого есть сервис HeyGen. Он позволяет загрузить картинку и речь, чтобы получить видео, где нейросеть очень старается сделать липсинк. И даже пробует немного шевелить персонажа. В большинстве говорящих ИИ-картинках вы видите результат работы именно этого сервиса.
Но с ним тоже пришлось помучаться. Помните улыбающегося Дудя? Вот причина, по которой я отказался от этого дизайна:
В процессе анимации это стал кто угодно, но только не Дудь. Нейросеть воспринимает улыбку, как базовые черты лица и из-за этого анимация становится странной. К тому же по голосу слышно, что человек не улыбается.
Но и с более строгим дизайном пришлось намучаться. Чаще всего проблема была в том, что нейросеть слишком сильно растягивала рот на акцентных моментах. Да и липсинк пока далёк от идеала.
Один раз НейроДудь даже впал в экзистенциальный кризис:
Чуть проще было генерить вставки с реакциями Дудя. Делал я их с помощью нейросетей "Kling O1" и "Seedance 1.5" на платформе Кrea. Например тут пытался воссоздать фирменный возмущённый взгляд в камеру:
В конечном итоге, НейроДудь получился хоть и криповым, но всё равно достаточно залипательным.
Кроме Дудя я сделал круглого робота, который влетает в кадр со мной. Он нужен, чтобы чуть удержать внимание зрителя вначале ролика, пока они привыкают к говорящему.
Визуал робота генерировал в Reve - это мой основной инструмент для создания отдельных объектов. Анимацию делал с помощью "Seedance 1.5" на платформе Кrea. В сцену добавил с помощью After Effects.
Оформление
Интервью Дудя сложно представить, без его фирменной отбивки. Только нужно было поменять музыку, чтобы ютуб автоматически не жаловался на авторские права.
Новый логотип сгенерировал с помощью той же Nano Banana, а ремикс на джингл в Stable Audio - это такая Suno курильщика. Пробовал вначале Suno, но сходу не получилось, а Stable сделал с первой попытки то, что нужно. Но за чем-то сложнее туда ходить точно не надо.
Итог
1. Это было весело.
2. Вся работа заняла примерно 3 дня
3. Если прикинуть общую подписку на сервисы и покупку токенов, то получится в районе $150
После интервью для Вышки я сел писать большую серию статей, где детальнее рассказал свой взгляд на будущее, а этот ролик стал классным дополнением.
ChatGPT снова довёл человека до суицида, оперативка подорожает на 70%, OpenAI запустили ChatGPT Health, Anthropic выпустили Cowork
AI-новости недели: OpenAI запустили ChatGPT Health, Anthropic релизнули Cowork — аналог Claude Code для непрограммистов, новые инструменты генерации от Qwen и Higgsfield, а цены на оперативку вырастут ещё на 70%. Всё самое важное о нейросетях — в одном ролике!
Альтернативный плеер YouTube
Ссылки из выпуска:
Мои ресурсы:
Xватит ли вам СМЕЛОСТИ съесть эти ЖУТКИЕ БЛЮДА?
Жуткая AI ASMR КОМПИЛЯЦИЯ. Вы бы съели такое угощение? Дайте мне знать в комментариях, что мне съесть дальше! Давайте пировать вместе! ⚠️ Все блюда в этом видео являются волшебными творениями, созданными исключительно для визуальных и ASMR целей. Не пытайтесь есть или воссоздавать эти предметы, используя реальные несъедобные объекты. Видео создано искусственным интеллектом и предназначено только для развлечения💫 #asmrsounds #relaxing #aiasmr #ai
Какое фото мне сделал ИИ с моей кошкой
Для создания такой фотосессии мы будем использовать Gramsi бота в Телеграме (Бот-нейросеть для генерации фото и видео)
Переходим в бота жмем /start
Отправляем фотографии человека и питомца, которых нужно добавить в референс.
Открываем редактор и выбираем модель нейросети Nano Banana Pro или ChatGPTImage
4. Пишем промт (описание желаемого результата). Пример готового промта будет ниже
5. Готово! Результат придет вам через несколько секунд
Промт для генерации:
Не меняя внешности человека с фото, кадр показывает драматическую близость лица (ваше) и (кошки), вплотную соприкасающихся. Правый глаз женщины смотрит в объектив, подчеркнут мягким контрастным светом, акцентирующим текстуру кожи . Ее глубокий взгляд с тенями подчеркивает форму глаза и внешний угол, создавая тревожное ожидание. Ресницы длинные, карие глаза ,внутренний уголок глаза прокрашен черным. идеальная виден хайлайтер на носу и скулах -золотой , пухлые губы длинные прямые волосы спускаются вниз, частично закрывая левую сторону лица. Слева на фоне в тени виднеется лицо черной кошки с ярким лицом. Приглушенный боковой свет формирует глубокие тени и контрасты между кожей, волосами и шерстью. Атмосфера насыщена напряжённостью, философской задумчивостью и мрачной эстетикой, вызывая внутреннее противостояние и глубокое кинематографическое ощущение. Фотореалистичное, высокая детализация, качество 8к.У девушки и кошки зеленые глаза Два фото, ваше и кошки.
Гайд по работе с Nano Banana для создания изображений
Эта инструкция поможет вам создавать качественные и реалистичные изображения с помощью искусственного интеллекта (ИИ) Nano Banana, избегая распространенных ошибок. Ключ к хорошему результату — это правильно составленный и доработанный под себя промпт. ИИ — это машина, которая требует точных и детализированных инструкций.
Часть 1: Основы работы с промтами
1. Сохранение вашей внешности (Самый важный блок)
При использовании готовых промптов из интернета всегда проверяйте и адаптируйте блок, отвечающий за сохранение внешности. Ваша цель — чтобы ИИ сохранил ваши черты, а не описывал чужое лицо.
2. Понимание промта и Поэтапный подход
Если вы берете промт на английском языке, обязательно переведите его.
Используйте поэтапный подход для сложных задач: сначала одежда, затем фон и поза и т.д. P.s. Nano Banana лучше понимает простые и логичные описания, а не длинные “Поэтичные” фразы
Часть 2: Выбор исходного фото для обработки
ВАЖНО! ИИ не «ретуширует» пиксели, он заново рисует картинку по вашим признакам. Когда лицо на фото не на переднем плане, модель видит «общие черты» и домысливает мелкие детали. Чтобы ИИ максимально точно сохранил вашу индивидуальность, необходимо дать алгоритму максимум информации именно о лице.
Рекомендации по выбору фото:
1. Портрет «голова-плечи»: Лицо должно быть крупно и по центру.
2. Освещение: Ровный свет без пересветов и глубоких теней.
3. Мимика: Нейтральная мимика; лицо открыто (без рук, капюшона, бликов на очках).
4. Качество: Фото нормального качества, без тяжёлых бьюти-фильтров и скриншотов.
Важное правило: Чем крупнее лицо в кадре, тем точнее ИИ сохранит вашу индивидуальность. Если есть только фото в полный рост — сделайте кроп до головы и плеч и отправьте его.
Примеры подходящих фото:
Головая и взляд прямо в камеру
Лицо хорошо считывается
Мимика нейстральная
Средний план съемки
Фото в хорошем качестве
Четко считывается черты лица и внешность
Средний план съемки
Фото в хорошем качестве
Четко считывается черты лица и внешность
Какие фото не подходят:
Голова повернута в другую сторону
Лицо плохо считывается
Дальний план в полный рост
Голова повернута в другую сторону
Селфи в зеркале
Голова повернута в другую сторону
Кривляние и сильное выражение эмоций
Совместное фото
Часть 3: Структура идеального промта
Хороший промпт состоит из нескольких логических блоков:
1. Сохранение внешности (Строгие инструкции)
2. Сцена (Окружение) (Место, время, погода)
3. Одежда (Детальное описание гардероба)
4. Поза и динамика (Движение, ракурс)
5. Свет и стиль (Освещение, настроение)
Пример полного промпта (Зимний уличный портрет)
1. Сохранение внешности: Создай ультрареалистичное фото по моему селфи. Сохрани мою внешность строго 1 к 1: те же черты лица, форма головы и челюсти, нос, губы, глаза, брови, линия роста волос, фактура кожи, поры, мелкие морщинки и естественная асимметрия. Не меняй возраст и пропорции лица, не сглаживай кожу, не добавляй цифровую ретушь и «улучшения». Выражение лица и направление взгляда должны остаться такими же, как на исходном селфи. Моё лицо нельзя заменять или перерисовывать.
2. Сцена:
Зимний уличный портрет в обычном городе. Фон — городская улица с домами и припаркованными машинами и стенами с новогодне оформленными витринами. На тротуаре лежит снег, по краям — сугробы, в воздухе может идти лёгкий снег.
3. Одежда:
Объёмный зимний пуховик или парка тёмного или нейтрального цвета (чёрный, графитовый, тёмно-зелёный или тёмно-синий), под ним виден слой тёплого худи. Широкие утеплённые джоггеры или мешковатые зимние брюки. Массивные зимние кроссовки или ботинки. На голове тёплая шапка-бинни.
4. Свет и стиль / Поза:
Естественный зимний дневной свет, мягкие отражения от снега, витрин и машин, лёгкое кинематографичное стрит-настроение. Стиль кадра — случайно сделанный кадр с живой динамикой города. Поза у меня прогулочная, естественная, в движении.
Часть 4: Адаптация промптов под разные стили
Чтобы изменить художественный стиль изображения, необходимо внести корректировки в блоки “Сцена”, “Одежда” и “Свет и стиль”, а также добавить ключевые слова, описывающие желаемый стиль. Блок “Сохранение внешности” всегда должен оставаться максимально строгим.
Часть 5: Негативный промпт (Negative Prompt)
ВАЖНО!
В конце каждого запроса обязательно добавляйте негативный промпт. Он нужен, чтобы ограничить “фантазию” ИИ и исключить нежелательные элементы.
Пример негативного промпта:
другой человек, изменение черт лица или формы головы, омоложение или изменение возраста, сильная ретушь и «пластиковая» кожа, отсутствие пор и текстуры, мультяшный стиль, аниме, иллюстрация, 3D-рендер, летний или осенний пейзаж, отсутствие снега, лёгкая летняя одежда, босоножки или лёгкие кеды, студийный фон вместо улицы, чёткие указания на конкретный город (надписи, узнаваемые здания, знаменитые достопримечательности), кислотные неоновые подсветки, сверхяркий пересвет, сильные цветовые фильтры, деформации тела или рук, лишние пальцы, размытое или искажённое лицо, текст, логотипы, надписи, водяные знаки
Сохраняйте гайд и делитесь с друзьями! Всем успехов!)
Особенности использования ИИ
Друзья, пикабушники, хочется с вами немного пообсуждать современную антиутопию ИИ, которая с каждым годом становится всё популярнее и популярнее. У меня, конечно, нет радикальных взглядов вроде полного запрета, особенно для детей. Но страшно становится, когда люди без осознания списывают всё, что выдаёт ИИ.
Под «списыванием» я понимаю не только нежелание проверять неточности, но и любое отождествление результатов ИИ с собственной личностью. То есть вы написали промт, получили готовый текст — и выдаёте его как свой, хотя даже малейшая часть вашего мозга в создании этого текста не участвовала.
Вот такая тенденция приводит к интересному эффекту: в «идеальном» сознании человек умеет писать тексты, а на практике — отбери у него чат-бота, и бац, оказывается, что сам он почти ничего не может. Я плавно перешёл к этой проблеме, потому что она очень похожа на ситуацию с ГДЗ. Хотя ГДЗ не создаёт что-то нестандартное — оно даёт готовые ответы. Даже если списываешь, оформление и адаптацию всё равно приходится делать самому.
Но давайте не будем превращать это в полную антиутопию. Плюсы ИИ очевидны: он наш помощник, опора, поддержка и, самое главное, будущее. Это катализатор технологического развития, который охватывает столько сфер, что это впечатляет и даже немного пугает — в хорошем смысле.
(Извиняюсь за неровный переход на другую тему, но как же хочется дожить до невероятного уровня развития, до космических кораблей и хвала Императору Человечества!)
Как БЕСПЛАТНО создать ИИ-модель с нуля в НЕЙРОСЕТИ
В этом видео я показываю полный процесс создания собственной ИИ-модели бесплатно и с нуля. Я подробно покажу, как сгенерировать реалистичное лицо в нейросети, как сохранить консистентность персонажа, чтобы он выглядел одинаково на всех изображениях и как создавать разные образы, позы и локации.
Также мы пройдем весь путь, от генерации лица до готовой виртуальной модели, которую можно использовать для соцсетей, контента, рекламы или личного бренда. Даже без опыта работы с нейросетями ты сможешь повторить все шаги и получить качественный, реалистичный и уникальный результат.
ИИ — спасение времени и нервов
А всё-таки искусственный интеллект — это забавная штука, столько времени экономит! Просто не представляю, как было в молодости, когда работал в заводской типографии: записывал какие-то тексты на бумажных отходах, потом приходил домой и переписывал... В общем, это что-то с чем-то, та ещё морока!
А сейчас иногда карандашиком на кассовом чеке какие-то тексты напишу, дома за пару минут голосом на телефон наговорю, а искусственный интеллект сам расставит знаки препинания, исправит ошибки и опечатки. На самом деле, классная тема! После тренировки на Пикабу можно перейти к работе над SEO-текстами, цель — обработать 100 нормальных, полноценных статей. Точка.
А я из тех, кто привык добиваться результата.





























