Как сгенерировать трендовое видео с музыкой из наушников? Уровень: СЛОЖНЫЙ
Для генерации будем использовать Telegram-бота PineappleAI — это нейросеть, в которой собрано множество инструментов для создания фото, видео и музыки.
Нам нужно сгенерировать 3 кадра перед созданием самого видео.
1. Заходим в бот
открываем pineappleAI в Telegram.
Нажимаем или вводим /start.
Подписываемся на канал с примерами промтов
2. Отправляем свои фото
Загружаем фотографии-референс
хорошее качество
лицо хорошо видно
без сильных фильтров
без перекрытий
3. Открываем редактор
В редакторе выбираем нейросеть для фото Nano Banana и ставим pro версию.
здесь также можно выставить формат фотографии(к примеру 3:4)
4. Вставляем промт:
копируем и вставляем описание для генерации:
Первое фото:
Используй загруженное фото как строгий референс. Сохрани личность и внешность персонажа 1:1 (лицо, возраст, цвет кожи, прическу/цвет волос), а также позу и пропорции. Не менять человека на другого. Сохранить естественность, без бьюти-ретуши и “пластика”.
Сцена: уютная гостиная у окна с прозрачными шторами. Персонаж сидит на сером диване боком, ноги согнуты и частично подняты на подушке, босиком. Одежда: спортивные черные лосины и черный спортивный топ к ним с очень длинным рукавом надетым через палец. В руках — крупные белые накладные наушники; акцент фокуса на руках и наушниках в переднем плане.
Свет: мягкий тёплый вечерний солнечный свет через окно, лёгкий боковой контровой отсвет, длинные мягкие тени, золотистая тональность, спокойное задумчивое настроение.
Кадр: вертикальный портрет 3:4, средний план по пояс, лёгкий боковой угол, фон с мягким боке (текстура штор и мебели читается, но не отвлекает).
Стиль: фотореалистичная редакционная lifestyle-фотография, кинематографическая цветокоррекция, лёгкая плёночная зернистость, естественные тона кожи, высокая детализация ткани и волос.
Камера: 50mm, f/1.8–f/2.2, ISO 200, 1/125, уровень глаз, shallow depth of field, резкость в плоскости рук и наушников.
Нажимаем отправить и получаем результат
Фото 2: Отправляйте фото, которое получилось при первой генерации
Используй загруженное фото как строгий референс. Сохрани личность и внешность персонажа 1:1 (лицо, возраст, тон кожи, прическу/цвет волос), а также ТОЧНО ТУ ЖЕ позу, ракурс, кадрирование и пропорции. Не менять человека на другого.
Изменение действия: крупные белые накладные наушники НАДЕТЫ на голове. Персонаж держит наушники обеими руками (ладони на чашках), глаза закрыты, выражение лица спокойное, как будто наслаждается музыкой. Все остальное оставить максимально близко к референсу.
Сцена: уютная гостиная у окна с прозрачными шторами, серый диван, ноги согнуты и частично подняты на подушке, босиком. Одежда: спортивные черные лосины и черный спортивный топ к ним с очень длинным рукавом надетым через палец.
Свет: мягкий тёплый вечерний солнечный свет через окно, лёгкий боковой контровой отсвет, длинные мягкие тени, золотистая тональность, спокойная атмосфера.
Кадр: вертикальный портрет 3:4, средний план по пояс, лёгкий боковой угол, фон с мягким боке (шторы и мебель на фоне размыты).
Стиль: фотореалистичная редакционная lifestyle-фотография, кинематографическая цветокоррекция, лёгкая плёночная зернистость, естественные тона кожи, высокая детализация ткани и волос.
Камера: 50mm, f/1.8–f/2.2, ISO 200, 1/125, уровень глаз, shallow depth of field, резкость на лице и наушниках.
Нажимаем отправить и получаем результат
Фото 3: отправляйте фото, которое получилось при второй генерации
Cinematic AR-composition with a dream effect: Spotify player cards with tracks of popular artists soar around the central photorealistic character in 3D space:
Taylor Swift, The Weeknd Billie Eilish, Ariana Grande, Lana Del Rey, Drake, Dua Lipa
Beyoncé, Bad Bunny, Olivia Rodrigo. The cards are placed at different depths - some cover the character from the front, others are on the side and behind, creating volume and parallax effect.
A realistic Apple Music / Spotify interface is used with correct playback progress indicators, neat rounded corners, light perspective and frosted glass effect with a soft glowing contour.
Typography remains clear and readable, without distortions and deformations.
The names of the artists are spelled out correctly and completely.
The lighting is cinematic, with a delicate bloom effect,, controlled by soft shadows and colour accents from track covers. The light transitions are smooth, soft.
The depth of sharpness emphasises the volume of the scene: the character is in focus, the cards gradually go into a soft blur in depth, preserving the realism and integrity of the environment.
Нажимаем отправить и получаем результат
5. Отправляем сгенерированные фото
Полученные 3 фотографии загружаем чат боту, снова открываем редактор
7. Выбор нейросети, промт
В разделе "видео" ищем нейросеть KLING, ставим длительность 10 секунд и вставляем следующий промт:
Use the first reference image as the exact starting frame and the second reference image as the exact final frame. Create a smooth, realistic transition between them. The woman is sitting on the gray sofa in a warm modern living room, holding white over-ear headphones. Starting from the first frame, she naturally lifts the headphones and puts them on her ears in one clean, elegant motion. As soon as the headphones touch her ears, floating holographic music cards begin to appear and fly around her, gradually filling the space until the scene matches the second reference image. Keep her face, body, outfit, sofa, curtains, lighting, camera angle, and room composition consistent. Motion should be cinematic, soft, premium, and realistic, with subtle parallax and seamless transformation into the final frame.
8. Нажимаем "отправить"
и ждём результат. В конце накладываем на видео свою музыку, например через CapCut.
























