Для Дизайна
14 постов
14 постов
5 постов
Инженер Стивен Ченг потратил четыре месяца на сборку робота, который патрулирует комнаты и охотится на насекомых.
Установка использует тепловизор, чтобы мгновенно распознавать летающих вредителей даже в полной темноте.
Как только цель верифицирована, нейросеть наводит прицел и уничтожает цель прямо в полете.
Причем ИИ в реальном времени сканирует пространство вокруг и блокирует выстрел, если рядом находятся люди, питомцы или легковоспламеняющиеся предметы.
Мне точно нужно такую на лето!
➡️ Все лучшие нейросети тут: TG | MAX
➡️ Обучение и Промты: TG | MAX
Исследователи из Стэнфорда решили проверить возможности ИИ в сфере юриспруденции.
Они сформировали базу анонимных ответов на сложные правовые вопросы, где тексты ученых смешали с генерациями искусственного интеллекта. Когда преподавателей попросили выбрать наиболее сильные и аргументированные работы, нейросети победили с разгромным счетом.
ИИ признали лучшим в 75 процентах случаев!
Залип на нейросетях и захотелось проверить байку, что один человек теперь может собрать целую короткометражку без команды. Взял три модели, потратил выходные и собрал 3-минутную анимационную фантастику. Без оператора, без студии, без актёров. Делюсь, как это устроено, чтобы вы не топтались там, где топтался я.
Картинку рисовал в GPT Image 2, оживлял кадры в Seedance 2.0, голос и звук делал в ElevenLabs. Все три модели у меня были в одном боте, так что не пришлось плодить аккаунты.
Главная ошибка новичка - кидаться сразу генерить красивые кадры. Я так и начал, потом всё переделывал. Сначала нужен сценарий. Для 3 минут это 300-400 слов. Дальше режешь его на отдельные кадры - на короткометражку выходит 20-40 штук. Под каждый кадр пишешь одно предложение, и оно потом превращается в запрос на картинку. Простой пример:
Общий план: заброшенная космическая станция, низкая орбита над оранжевым газовым гигантом, тусклый аварийный свет, ретрофутуризм.
Тут важная штука - стилевой блок. Это кусок текста про общий вид (свет, палитра, формат), который ты приписываешь к каждому запросу. Без него картинки расползаются по стилю, и фильм выглядит, будто его клепали пять разных человек.
Ещё до сцен сделай лист персонажа - героя с разных ракурсов. Сохрани и потом ссылайся на него везде, где этот герой в кадре. И сразу настройся переделывать: нормальный кадр выходит с 2-4 попытки. Плохую картинку не дожимай правками, проще начать заново.
Видеомодель хороша в атмосфере: дым, свет, частицы, медленный наезд камеры, лёгкое движение героя. А вот сложный экшен и говорящие крупные планы с губами она тянет плохо. Поэтому план простой: атмосферу и общие планы делаешь видео, а крупные планы с речью оставляешь статичными картинками.
Лайфхак, который сэкономил мне кучу нервов: если в кадре есть твой конкретный объект из GPT Image 2 - оживляй именно эту картинку (режим из первого кадра), а не пиши заново текстом. Иначе модель уплывает в свою сцену. В запросе описывай только движение, коротко:
Медленный наезд камеры, плавают частицы пыли, аварийный свет мерцает.
Клипы выходят по 4-8 секунд, на фильм нужно 25-40 штук. Заведи табличку: номер кадра, описание, файл, статус. Без неё на монтаже утонешь.
Звук - то место, где разваливается большинство любительских ИИ-фильмов. Робоголос и стоковая музыка убивают даже красивую картинку. На каждого героя заводишь свой голос и больше его не трогаешь. Реплики озвучивай по одной - так проще переделать строчку и собрать всё в монтажке. Файлы называй по-человечески: char1_line01, char1_line02.
Там же делаются звуковые эффекты (гул, шаги, сигналки) и фоновая музыка. Сгенерь 2-3 трека под разное настроение: напряжение, тишина, кульминация.
Дальше обычный монтаж в любой программе - DaVinci Resolve, CapCut, что привычнее. Три приёма, которые реально помогают с ИИ-видео:
• Режь по звуку, а не по картинке - у ИИ-клипов движение кривоватое, по репликам склейка чище.
• Не каждому кадру нужно движение - статичный кадр со слоями звука часто бьёт сильнее.
• Прогони общую цветокоррекцию - ИИ-картинки гуляют по цвету, единый оттенок собирает фильм в одно целое.
И не растягивай. ИИ-фильмы вечно ползут медленно. 3 минуты должны ощущаться как 3 минуты. Режь смелее.
По времени у меня ушло около двух выходных, но первый блин всегда комом - дальше быстрее. Самое узкое место не инструменты, а процесс: чёткий план отделяет фильм, который ты доделал, от того, что бросил на середине.
А вы бы какую короткометражку собрали первой? Пишите в комменты.
Был случай: отдал клиенту переведённую инструкцию, а там машина проглотила одно «не». Смысл шага перевернулся, клиент чуть не спалил оборудование. С тех пор правило простое: машине верю на черновике, на чистовике перечитываю руками. Ниже - без воды, как я это делаю.
Сразу про инструмент. Держу под рукой бот Cyber AI - там в одном окне Claude, GPT и Gemini. Кидаю один абзац всем троим, смотрю, у кого вышло живее, и беру это. Не надо скакать по сайтам.
Когда можно не париться
Если задача просто понять, о чём текст - письмо от поставщика, чужая заметка, условия сервиса - хватает короткой команды: «переложи на русский, смысл сохрани, от себя не добавляй». Дальше глазами пробегаю по цифрам, именам, датам и частице «не». Вот тут нейронка спотыкается чаще всего, остальное обычно в порядке.
Где халтура не прокатит
Если текст идёт наружу - в рекламу, в договор, на сайт, в обучалку - одним прогоном не отделаешься. Перевод должен сам по себе работать, а не быть подстрочником. В статье держим мысль автора и манеру. На лендинге - оффер, выгоды и кнопку. В инструкции - точность до шага, никаких «я тут красивее сформулировал». А договоры машина трогает только начерно, финал смотрит живой юрист.
Что сказать модели, чтобы не было каши
Главная ошибка новичка - бросить голое «переведи» и ждать чуда. Без рамок выходит пресная середина. Я всегда докидываю: какая пара языков, что за текст, кто читатель, какая цель, какой тон и какие слова трогать нельзя. И отдельно - не сокращай, цифры и названия не меняй, сомнительное помечай. Разница в качестве на порядок.
Боль с терминами
Самое мерзкое в длинных текстах - термины. В одном абзаце «release» перевёл как «релиз», в другом как «выпуск» - и читатель уже думает, что это разные штуки. Лечу так: до старта собираю мини-словарик и заставляю модель держать его по всему тексту. В конце прошу отдельно: проверь, везде ли термины одинаковые.
Тон тоже улетает
Ещё модель любит причесать всё под скучный канцелярит. Бодрый английский после перевода превращается в отчёт из бухгалтерии. Поэтому прямо прошу: «держи деловой, но живой тон», «не пихай рекламные усилители», «фразы покороче». И беру сразу два варианта - точный и причёсанный, чтобы сравнить.
Как проверяю на выходе
Орфографией дело не кончается. Сверяю смысл: на месте ли условия, отрицания, сроки и числа. Потом термины по словарику. Потом тон. Потом формат - ссылки, списки, единицы. И отдельно всё про деньги, право и технику - это только через человека. Иногда саму модель сажаю проверяющим: даю оригинал и перевод, прошу найти расхождения. Но финальное слово за мной.
Короче
Нейросеть - отличный черновик и помощник, но не замена головы. Дай ей контекст, забери пару вариантов и перечитай итог. Чем дороже ошибка, тем меньше доверяй одному автоматическому прогону.
Ещё промпты и разборы нейросетей: наш Telegram | MAX
Решил сделать клон своего голоса через ElevenLabs. И сразу уперся в скучное: чтобы копия получилась нормальная, надо записать минимум полчаса речи. А что читать эти полчаса - непонятно.
На Reddit подсмотрел лайфхак. Текст для записи можно не писать руками: даешь команду нейросети Claude, и она сама собирает сценарий под твой голос. Делюсь промптом, забирайте.
Сначала зачем вообще полчаса. Клон голоса - это модель, которую обучают на твоей записи. Чем больше и разнообразнее запись, тем точнее копия. И важный момент: модели плевать, ЧТО ты читаешь. Она копирует, КАК ты звучишь - тембр, интонации, паузы. Поэтому монотонно бубнить полчаса бесполезно, нужен живой текст с эмоциями.
Сам промпт. Копируешь, вставляешь в Claude. Он задаст четыре вопроса про голос и выдаст готовый сценарий нужной длины:
Ты - сценарист, который пишет текст для записи голоса под клонирование в нейросети.
Моя цель - записать аудио и сделать копию своего голоса. Качество клона зависит не от того, ЧТО я читаю, а от того, КАК звучит мой голос: тембр, интонации, паузы и эмоции. Поэтому текст должен быть живым и разным по настроению.
Сначала задай мне четыре вопроса, по одному за раз:
1. Какой голос я записываю: разговорный, диктор, персонаж, блогер, реклама, обучающие уроки или развлечения?
2. Какой характер у голоса: спокойный, энергичный, дружелюбный, строгий, дерзкий? Можно несколько.
3. На каком языке записываю и сколько минут готов читать: 15, 30 или 60?
4. Есть ли темы, которых лучше избегать?
После моих ответов составь готовый сценарий для начитки:
- Раздели на блоки по 2-3 минуты с подзаголовками.
- Чередуй спокойные и эмоциональные куски: вопросы, восклицания, паузы, числа, имена.
- Смешивай короткие и длинные предложения.
- Добавь пару диалоговых реплик.
- В скобках подсказывай настроение: (спокойно), (с улыбкой), (быстрее).
- Подбери объём под выбранную длительность.
Не объясняй теорию - сразу выдай текст, который я могу читать вслух.
Как пользоваться: вставил промпт, ответил на вопросы (тип голоса, характер, язык, сколько минут), получил текст. Надо длиннее - просто просишь Claude дописать. Дальше читаешь на микрофон в тихой комнате, как обычно говоришь, без наигрыша.
Озвучить текст или клонировать голос можно прямо в нашем боте - там ElevenLabs встроена, отдельно регистрироваться не надо. Путь: 🎵 Музыка и Озвучка - 🗣️ Elevenlabs - Задать параметры. Режим Свой голос - грузишь запись и делаешь клон, режим Озвучка диалога - просто читаешь текст голосом. Язык ставишь Русский. И Claude Opus 4.8 там же, чтобы сгенерить сам сценарий.
А чей голос вы бы клонировали в первую очередь - свой, любимого персонажа или диктора из рекламы?
Надоело показывать ремонт скучными фотками. Закинул один кадр комнаты в нейросеть Seedance, добавил строчку про движение камеры - и через пару минут получился плавный видео-облёт, как в рекламе недвижимости. Ни 3D-программ, ни оператора, просто фотка плюс текст.
Работает так: грузишь фото комнаты как первый кадр, пишешь как двигать камеру - модель сама достраивает движение и старается не «ломать» мебель и свет. Ниже три промпта, которые зашли лучше всего. Можете копировать как есть.
Камера ползёт к окну, по полу едет свет - картинка сразу оживает. Идеально для гостиной с большим окном.
Кинематографичный медленный наезд камеры в сторону большого окна. Мягкий дневной свет, плавное движение, тёплые тени скользят по деревянному полу. Камера движется плавно, без рывков. Освещение и интерьер остаются неизменными. Без людей, без текста.
Проход слева направо показывает комнату целиком. Удобно, когда надо за пять секунд показать всё помещение.
Плавная панорама камеры слева направо по комнате. Мягкий свет, неподвижный интерьер, спокойный кинематографичный темп. Освещение остаётся неизменным. Без людей, без текста.
Камера идёт снизу вверх и раскрывает высоту. На лофтах и двусветных гостиных смотрится особенно сочно.
Камера плавно поднимается снизу вверх, открывая высокий потолок. Мягкий рассеянный свет, неподвижный интерьер, плавное движение без рывков. Освещение остаётся неизменным. Без людей, без текста.
Пара мелочей, чтобы вышло чисто: бери чёткое исходное фото, пиши «без людей, без текста», держи ролик в районе 5-8 секунд и добавляй «освещение остаётся неизменным» - тогда свет не скачет.
Решил проверить, насколько Kling 3.0 реально «киношный». Прогнал 7 промптов на разные настроения - от утреннего кафе до ночного неона. Картинка местами как из рекламы, делюсь промптами, можете повторить.
Сразу скажу: видеомодель творческая, один и тот же промпт каждый раз даёт чуть разный ролик. Промпт задаёт стиль и свет, а детали Kling дорисовывает сам. Так что это не баг, а фишка.
Тёплый лайфстайл-кадр, как в рекламе кофеен.
Молодая женщина в бежевом тренче за уличным столиком кафе с двумя чашками эспрессо, тёплый дневной свет, зелёные растения на фоне. Кинематографичный кадр 35мм, тёплая цветокоррекция, малая глубина резкости. Без текста.
Самый дорогой по картинке - облёт над водой на закате.
Низкий полёт камеры над гладью горного озера на закате, заснеженные пики, оранжевое небо, хвойный лес по берегам, отражения в воде. Кинематографичный широкоформатный кадр 2.39:1, мягкая дымка. Без людей, без текста.
Неон и мокрый асфальт, классика для клипов.
Женщина в светлом тренче идёт по ночной неоновой улице, мокрый асфальт отражает огни вывесок, камера следует сзади. Кинематографичный кадр 35мм, холодные сине-розовые тона. Без текста.
Фонарь, брусчатка, тени - готовый детектив.
Мужчина в тренче и шляпе в узком брусчатом переулке ночью под фонарём, влажная мостовая, нуар-атмосфера. Кинематографичный кадр 35мм, глубокие тени, тёплый свет фонаря. Без текста.
Лёгкое лето с мягким светом.
Женщина в белой блузке идёт по солнечной аллее в парке, мягкий свет сквозь листву, тёплые блики. Кинематографичный кадр 35мм, летняя палитра, малая глубина резкости. Без текста.
Уютный медленный портрет.
Девушка в светлом свитере читает книгу на скамейке в парке, золотистый свет, размытый зелёный фон. Кинематографичный портрет 35мм, тёплая палитра. Без текста.
Контрастный ночной кадр для динамики.
Мужчина в кожаной куртке идёт по ночной улице с неоном, мокрый тротуар, синие и красные отблески витрин. Кинематографичный кадр 35мм, контрастная ночная палитра. Без текста.
Что помогает попасть в задумку: описывай кадр по слоям (объект, фон, свет, движение камеры), добавляй киноязык вроде «кадр 35мм» и «малая глубина резкости». Если нужен конкретный предмет крупным планом - грузи свой первый кадр, тогда картинка не уедет. И лайфхак: Kling часто лучше понимает короткие промпты на английском.
Подсел на Claude по работе: код пишет чище, документы разбирает аккуратнее, инструкции выполняет точнее, чем ChatGPT. Беда одна - напрямую в России он не пашет, картой не заплатить. Разобрался, как пользоваться и платить рублями. Рассказываю по-человечески.
Если коротко - это рабочая лошадка для кода, текста и документов. По коду разработчики в один голос: Claude пишет компактнее и идиоматичнее, ChatGPT чаще лепит рабочие, но громоздкие решения. На рефакторинге и дебаггинге разрыв ещё заметнее. По рынку начала 2026 года Anthropic держал около 54% корпоративного сегмента ИИ для разработки - это о чём-то да говорит.
Инструкции выполняет точно, без «додумывания» лишнего. Тексты выходят живее, меньше воды и канцелярита. Честно про минусы: свежих данных из сети по умолчанию нет, картинки не рисует. Для бытовых мелочей разница с конкурентами невелика, а вот на серьёзной работе она и вылезает.
Без контекста задачи сравнивать смысла нет, но по рабочим сценариям расклад такой:
• Сложный код и дебаггинг - Claude ★★★★★, ChatGPT ★★★★☆, Gemini ★★★☆☆, Grok ★★☆☆☆
• Работа с документами - Claude ★★★★★, ChatGPT ★★★☆☆, Gemini ★★★★☆, Grok ★★☆☆☆
• Следование инструкциям - Claude ★★★★★, ChatGPT ★★★☆☆, Gemini ★★★☆☆, Grok ★★☆☆☆
• Качество текста - Claude ★★★★★, ChatGPT ★★★★☆, Gemini ★★★☆☆, Grok ★★★☆☆
• Поиск свежей инфы - Claude ★★☆☆☆, ChatGPT ★★★★★, Gemini ★★★★★, Grok ★★★★☆
• Реалтайм из соцсетей - Grok ★★★★★, остальные слабее
По нишам: ChatGPT - универсал с сильным поиском, Gemini берёт огромным контекстным окном и Google-экосистемой, Grok силён только данными из X в реальном времени. На код и точные формулировки Claude обходит всех.
• Claude Opus 4.8 - самый мощный. Сложный код, архитектура, объёмная редактура, юридические и технические документы.
• Claude Opus 4.7 - повседневные рабочие задачи и тексты.
• Claude Opus 4.5 - аналитика документов, где важна точность.
• Claude Sonnet 4.6 - быстрый и качественный, отличная точка входа для знакомства.
Все модели понимают русский без настроек и принимают на вход PDF, скриншоты и фото - можно работать с содержимым напрямую.
Anthropic режет доступ по географии: российские IP под ограничениями, карты не проходят - стандартный санкционный комплаенс, не точечно против страны. Обойти самому через зарубежную карту, смену IP или ВПЭН - лотерея: аккаунты блокируются, доступ слетает в самый нужный момент.
Два рабочих способа, оба - обычной картой за рубли.
Способ 1 - подписка Claude Pro, оформляется на Озоне. Заходит, если работаешь с Claude постоянно. Способ 2 - наш бот Cyber AI: Claude Opus 4.8 встроен внутри, пишешь на русском, можно прикрепить файл. Удобно для разовых задач.
Оформить Claude Pro - на Озоне за рубли. Разовые задачи без подписки - Claude Opus 4.8 уже в нашем боте Cyber AI: TG | MAX.
Работает ли Claude в России? Напрямую нет, через подписку Claude Pro на Озоне или через бот - да.
Понимает русский? Да, все модели, без настроек.
Кому что брать? Новичку - Sonnet 4.6, под сложное - Opus 4.8.
Если зашло - плюсани, так пост увидит больше народу. А ты какой нейронкой пользуешься для работы? Пиши в комменты.
