Maloron

Maloron

Обо всем понемногу Авторское еще тут: https://t.me/InTrendsWeTrust
Пикабушник
Дата рождения: 9 июля
13К рейтинг 8 подписчиков 2 подписки 36 постов 4 в горячем
Награды:
5 лет на Пикабу

Обычный день в токийском метро1

Источник: https://t.me/InTrendsWeTrust/604
Кадры собирал из MidJourney, анимировал в Hailuo AI

Чуть позже думаю распишу рабочий процесс, если кому-то вдруг интересно.

Mortal Kombat со знаменитостями

Я с новым GenAI видео. Получилось более чем годно. Мы с товарищем видели, что хайпуют некоторые авторы на таких роликах, и задался я вопросом, сложно ли повторить и сделать лучше. Спойлер — нет ничего невозможного.

Кадры для видео делал в Midjourney и Ideogram.

Получилось более чем удачно. Мой канал и источник: https://t.me/InTrendsWeTrust/613
Там позже разберу с какими сложностями столкнулись и что было трудного :)

Показать полностью

Генеративное аниме

Продолжаю создавать Ai-content

На этот раз аниме. Что интересного — собственно тут только 3 инструмента:

Midjourney, HailuoAi, ElevenLabs.

При этом считаю, что сохранение персонажа, т.е его консистентность в разных сценах исполнена хорошо.

Интересных идей и кадров еще больше, просто делать длинную историю пока не вижу смысла 🤷‍♂️

Все сгенерировано, кадры, анимация, звук — если вы еще не внедряете в пайплан производства контента, игр или фильмов — нейронки — вы просто пропускаете хорошие инструменты.

Взято из - https://t.me/InTrendsWeTrust/611 . Мой канал, пишу там о нейронках, если интересно - буду рад видеть.

Показать полностью

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat

Как использовать ChatGPT 4 или Llama, но платить за подписку и не париться со сложностью доступа? Платформа LLM Arena предоставляет возможность бесплатно и без регистрации протестировать популярные LLM-модели, включая ChatGPT-4, Claude, Gemini Pro 1.5 и даже Яндекс Чат GPT (YaGPT). Здесь вы можете устроить настоящее «сражение» нейросетей, чтобы определить лучшего помощника для ваших задач.

В этом гайде разберу, как максимально эффективно использовать платформу и получить все преимущества от тестирования нейросетей для генерации текста.

Почему стоит выбрать LLM Arena

LLM Arena — уникальная платформа, позволяющая сравнивать различные языковые модели (LLM) в одном месте. Вы можете одновременно задать вопрос нескольким нейросетям, например, ChatGPT и Claude 3.5 Sonnet, и сравнить их ответы. Также доступны отечественные модели: GigaChat от Сбербанка, T-lite от Т-банка и экспериментальная YandexGPT-4. Все эти нейросети собраны в одном интерфейсе, что позволяет быстро переключаться между ними и выбирать оптимальную для ваших нужд. С их помощью вы сможете генерировать тексты, решать задачи, писать код и находить решения сложных вопросов.

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

Одна из ключевых особенностей LLM Arena — режим анонимного сравнения. Если вы новичок в мире нейронных сетей и не знаете, какая модель вам подходит, этот режим идеален для вас. Платформа случайным образом подбирает модели, и вы не узнаете их названия до окончания тестирования. Это позволяет объективно оценить качество ответов, не основываясь на известности модели.

Если вы не хотите самостоятельно проводить тестирование, можете воспользоваться рейтингом чат-ботов, составленным другими пользователями.

Возможности LLM Arena для ваших задач

Платформа LLM Arena подходит не только для сравнения нейросетей, но и для бесплатной генерации текста, создания заголовков, написания саммари и даже для обучения. Она ориентирована на русскоязычную аудиторию, поэтому вы можете задавать вопросы и писать запросы на русском языке.

Создание привлекательных заголовков

Промпт: «Вы — опытный копирайтер. Придумайте 5 интригующих и вовлекающих заголовков на тему [тема]. Заголовки должны мотивировать читателя открыть и прочитать статью».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

Написание постов и статей

Промпт: «Вы — профессиональный копирайтер. Напишите лид для статьи на тему [тема], не более 580 знаков с пробелами. Используйте живой и понятный язык, избегайте сложных слов и предложений. Сделайте акцент на [аспект, на котором следует сфокусироваться в лиде]».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

Разработка программы обучения

Промпт: «Вы — опытный преподаватель по [английскому языку]. Составьте программу для изучения [английского с нуля] на полгода. Я готов заниматься [1 час каждый день]. Предложите список учебников и материалов, которые помогут в изучении».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

Генерация саммари

Промпт: «Сделай краткое саммари [книги Ильяхова «Пиши, сокращай»]. Выдели основные тезисы, которые помогут мне [развить навыки копирайтера]».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

Текстовые нейросети составляют саммари книги

Объяснение сложных терминов

Промпт: «Объясни простым и понятным языком, что такое [термин]. Поясни так, чтобы даже пятилетний ребенок понял».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

LLM способны объяснять различные термины

Создание простого кода

Промпт: «Напиши код для SEO-инструмента, который позволяет загружать блог-пост, указывать отрасль и ключевые слова. После загрузки информации должна появиться кнопка анализа с подсвеченными предложениями по улучшениям. Добавь кнопку сброса для нового начала и возможность добавления нескольких ключевых слов. В области предложений по SEO после анализа предоставь конкретные цифры и статистику из блог-поста, а также предупреждения о проблемных местах».

Какой ИИ лучше? Тестируем ChatGPT бесплатно и сравниваем с Llama, YandexGPT, GigaChat Искусственный интеллект, Нейронные сети, Чат-бот, ChatGPT, Google, Яндекс, Gpt4, Длиннопост

У нейросетей даже подход к кодингу различный

Как начать пользоваться сервисом

Регистрация и оплата не требуются — можно приступать сразу. В верхней части экрана выберите режим: «Анонимный» или «Сравнение».

Обратите внимание на правила использования платформы и помните, что не стоит загружать личную информацию.

Если выбрали режим «Сравнение», укажите две модели, которые хотите протестировать.

Под полем ввода настроек задайте параметры:

  • Temperature — креативность нейросети. Чем выше значение, тем более оригинальными будут ответы. Значение от 0,5 и выше подходит для создания историй, рекламных текстов и развлекательного контента.

  • Top-p — разнообразие словарного запаса. Высокое значение позволяет нейросети использовать более редкие и креативные выражения, что полезно для неожиданных поворотов в тексте.

  • Max output tokens — максимальный объем ответа. Для длинных текстов рекомендуется устанавливать большее значение.

Введите свой промпт в поле и нажмите Enter. После завершения теста выберите модель, которая вам понравилась больше.

В режиме «Сравнение», если вы самостоятельно выбираете модели, ваш голос не учитывается в общем рейтинге. Чтобы повлиять на формирование топа, используйте анонимную арену.

Подведем итоги

  • LLM Arena позволяет бесплатно и без ограничений в России использовать продвинутые модели искусственного интеллекта, такие как ChatGPT-4, Claude 3.5 Sonnet, Gemini Pro 1.5, Llama и другие.

  • Вы можете одновременно тестировать две нейросети в одном окне, что упрощает процесс сравнения.

  • На платформе доступен пользовательский рейтинг языковых моделей, который помогает быстро найти самую мощную нейросеть.

  • Вы сами можете влиять на рейтинг, оценивая нейросети через анонимное сравнение на LLM Arena.

Используйте LLM Arena, чтобы найти идеальную нейросеть для генерации текста и решить любые задачи с помощью передовых LLM-моделей!

Показать полностью 7

Трейлер несуществующего фильма

Продолжаю создавать несуществующие шедевры кино

🔥 (рекомендую со звуком смотреть)

В этот раз пробовал экспериментировать с довольно сложными переходами и более динамичными сценами, вроде получилось довольно хорошо.

Пытался выгрузить в 2к, но загрузчик ругается.

Источник (https://t.me/InTrendsWeTrust/606)

Показать полностью

Продолжение поста «Обычный день в токийском метро»1

Собственно, попробую подробно описать, как вам самостоятельно создать такое видео и попробую познакомить с несколькими тонкостями процесса.

Идея в условиях ограничений

Начнем с главного, а именно идеи вашего видео. Здесь очень важно понимать, что генеративные нейронки довольно ограничены в контексте продолжительности ваших видео. Поэтому вам нужно либо уметь компоновать разные кадры для вашей истории (используя перебивки, например, фокус на деталях одежды и т.д.), либо использовать на пост-монтаже звуковые переходы, либо ваша идея должна предполагать вариант спокойной смены кадров (в случае как у меня, это скорее вирусный ролик, где всю концепцию объединяет поезд с разными существами, связанных с японской мифологией или искусством).

В сухом остатке, ваша идея должна быть выполнима и адаптивна с учетом пока что несовершенных инструментов создания контента. То есть если вы захотели сгенерировать кота, который пашет на заводе, будьте готовы, что у него лапки, и например генеративный инструмент может не всегда адекватно воспринимать ваше пожелание.


Создание контента

Создание кадров


Мой процесс построен так:
Придумываю образ/концепт -> обращаюсь к GPT за помощью -> создаю картинку в Midjourney -> дорабатываю идею для анимации кадра в GPT -> иду анимировать в HailuoAi.

Зачем тут GPT? Для экономии времени. Вы создаете диалог, в котором прописываете следующую инструкцию:

Напиши 10 промтов на английском для Midjourney. Рядом с каждым промтом краткое описание на русском. Каждый промт содержит описание цветовой гаммы и света на кадре. Все промты должны быть нацелены на создание кинематографичного кадра (начинаются примерно с "cinema shot of..."). Концепция следующая: монстры-екаи в токийском метро. Разрешение 9:16 (укажи --ar 9:16) Каждый промт должен быть самодостаточным и поддерживать единую общую цветовую гамму концепции. В каждом промте должно быть уникальное существо.

Каждый может доработать по вкусу (разрешение кадра, концепция, кол-во промтов), но суть ясна. Далее в рамках этого диалога с GPT и работы с Midjourney мы отбираем контент, докидываем свои решения в стиле "О, а давай еще промт про девочку красивую в маске лисы, таинственно идущую в другой вагон". Также, учитывая предыдущий контент GPT поймет ваш запрос и выдаст вам примерный необходимый промт для Midjourney.

Часть промтов надо будет редактировать вручную, но это гораздо проще, чем прописывать каждый с самого начала или втухать, если идеи идут сложно.

Анимация кадров

Итак, вы отобрали кадры, теперь пора их оживлять. На помощь снова приходит GPT. Но уже с довольно сложным промтом (его надо скопировать и вставить в GPT):

Scene: The video starts with the camera zooming out from a close-up of the robotic cat's large eyes, revealing its entire body. The cat then moves slightly, its mechanical head turning to look down at its own body as if it's becoming aware of itself for the first time. It examines its paws, curiously tilting its head. The scene emphasizes the cat’s intricate robotic details, such as gears and the reflective surfaces.

Lighting: Soft, warm lighting fills the scene, highlighting the cat's golden metallic accents and giving a friendly, almost whimsical feel. The light glimmers off the polished surfaces of the cat’s mechanical components, making it seem lively.

Angle: The camera begins with a tight focus on the eyes, then pulls back smoothly, revealing the whole robot cat as it moves. As the cat inspects itself, the camera gently follows its gaze and movements, adding to the feeling of curiosity.

Color Correction: Golden and warm shades dominate the scene, with muted browns and metallic colors giving a steampunk feel. The reflective eyes have a glowing amber quality, adding warmth to the scene.

Action: The robotic cat lifts one paw, turns its head slightly, and looks at different parts of its body with apparent curiosity. The scene captures this as an exploration, showcasing both the robot's design and its almost childlike curiosity.

Camera Movement: The camera starts close on the eyes, then smoothly zooms out, maintaining a soft focus until the entire cat is visible. Once the camera has pulled back, it follows the cat’s slight movements as it explores itself, enhancing the sense of discovery.

Вот структура промта. На ее основе на китайском распиши промт для картинки, что я пришлю. Учитывай, что генеративные ИИ для видео не помнят предыдущий контекст и детали, чтобы сцены выглядели логичными и последовательными необходимо добавлять детали в каждом промте, а также делать их самодостаточными. Данный промт это структура для всех последующих промтов для генеративной нейросети по созданию видео или анимированию картинок. Каждый раз, когда я присылаю картинку, старайся описывать по такой структуре результат промта на основе моих вводных данных, если только не сказано иного. Добавляй к каждому промту краткое описание на русском в самом конце, чтобы я мог понять о чем речь.

Теперь, после того, как вы создали отдельный диалог и выгрузили туда данный промт - вы загружаете в диалог картинку со своим кадром и просите кратко что хотите, например "Персонаж стоит, смотрит в кадр, а затем начинает убегать прочь, отдаляясь от камеры". GPT преобразует это в сложный промт по структуре на китайском языке.


ВАЖНО: иногда, для простых действий этот сложный промт не подойдет, в этом случае я прошу GPT сильно упростить промт, но чтобы сохранился мой запрос анимации кадра. И тогда получаю короткий, но понятный промт.

Почему китайский? Изначально генеративный ИИ Hailuo имеет китайские корни, и под капотом натренирована чаще на запросах на этом языке. Поэтому можно пробовать английский и даже русский, но череда экспериментов показала, что в сложных инструкциях, китайский лучше.

Нюансы работы с генеративными ИИ

В начале поста я рассказывал про важность адаптивности, с чем это связано? Объясню на примере. Вот в моей голове в моем видео, ворон-тенгу, должен был превращаться в множество ворон, разлетающихся в разные стороны, итак, что у меня вышло после нескольких попыток:

В общем, ожидание не получилось воплотить в реальность, а учитывая, что каждую генерацию надо ждать от 5 до 10 минут, то была идея попробовать другие варианты, которые могли бы выглядеть более достойно. Для этого я поработал с GPT, спросил у модели, какие варианты он считает могут быть еще, подумал сам, сгенерировал простые и сложные промты и стал пробовать:

Вот оно, я понял, что бег выглядит более зрелищно и интересно, особенно в концепции вертикальных видео для соцсетей. Что делал далее, понял, что бег в этом ключе меня не устраивает, в рамках сложного промта и попробовал сделать его проще, в итоге получил это:

То есть важно помнить, что кроме изменений промта, есть еще фактор рандома, и ваш идеальный кадр может быть не сразу а спустя 3-4 генерации. В теории можно пробовать и хоть 10 генераций, но если честно обычно я рекомендую подумать еще или адаптировать промт/саму идею, т.к. если задачи, которые крайне сложно реализовать. Повторюсь, генеративные ИИ пока еще не идеально понимают запросы.

Саунд-дизайн

В общем, тут я однозначно рекомендую ElevenLabs, там есть функция генерации звуковых эффектов до 20 секунд длительностью и примерно 70% звуков в моем видео, сделаны именно там.

Продолжение поста «Обычный день в токийском метро» Вертикальное видео, Искусственный интеллект, Креатив, Telegram (ссылка), Видео, Без звука, Ответ на пост, Длиннопост


Доводим кадры до ума, добавляем саунд-дизайн, склеиваем в любом редакторе наши кадры и вуаля, вы великолепны.

Собственно основное аспекты я рассказал, если возникнут вопросы - в комментариях постараюсь ответить, а может и дополнить пост. Для вас вещал автор канала Верю только трендам. По ссылке как раз ролик, подход к генерации которого разбирал тут. Если вам интересен генеративный контент и вопросы нейронок, буду рад видеть и на канале.

Что я использовал, сколько стоит и чем заменить:

Я пользую платный GPT, самую дешевую подписку MidJourney (10$) и HailuoAi. Когда я генерил ролик, у меня были бонусные часы генерации от Hailuo, да, если сейчас у них купить подписку за 10$, то получаешь 3 дня безлимита, если вам было интересно попробовать и вы хотите прям погрузиться в безлимитные генерации - то шанс реально хороший.

А можно бесплатно? В теории -- да!

Например для генерации кадров можно использовать бесплатный SD - рассказал тут. Но важно помнить, что тот же MJ кинематографичнее. Насколько знаю, есть еще бесплатные версии Flux, но они ограничены по числу генераций.

Hailuo AI доступна бесплатно?

Сейчас - частично да, насколько я вижу, то при авторизации с нового логина, мне дали те же бесплатные 3 дня.

Продолжение поста «Обычный день в токийском метро» Вертикальное видео, Искусственный интеллект, Креатив, Telegram (ссылка), Видео, Без звука, Ответ на пост, Длиннопост

Пруфы.

Ну, а базовые версии GPT итак доступны бесплатно. Если с доступом к нему трудности, то всегда есть замечательные сервисы бенчмарка типа llmarena.ru, где вы можете тестировать вообще разные текстовые модели. Но картинки он правда пока не воспринимает для загрузки, но вот с промт-составлением поможет точно.

Если у вас трудности с оплатой, то могу сказать так, сам все оплачиваю через посредников, коих довольно много, и переплачиваю в среднем процентов 10-20, но от суммы в 10$ это не так много.

Показать полностью 2 4

Как без регистраций и установок генерировать изображения в Stable Diffusion 3

Как без регистраций и установок генерировать изображения в Stable Diffusion 3 Искусственный интеллект, Креатив, Stable diffusion 3, Stable Diffusion, Digital, Длиннопост

Продолжаю цикл постов про нейронки, которые могут пригодиться.

Сегодня поговорим про Stable Diffusion 3.0, которая вышла не так давно и уже успела стать предметом обсуждений. Да, важно оговорится, модели SD можно разворачивать на собственном устройстве и делать это довольно просто, но я предпочитаю пользоваться в текущем варианте версиями, представленными на Hugging Face https://huggingface.co/stabilityai/stable-diffusion-3-medium (в правой части экрана, при открытии сайта у вас будет доступно множество пользовательских билдов).

Одна из интересных SD3 With VLM And Prompt Enhancer. VLM — с Promt Enhacer поможет распознать референс и составить по нему промт, разумеется стиль он за вас не угадает, но облегчить задачу может.

Сам я для генераций в примерах данного поста использовал самую базовую модель.

Как без регистраций и установок генерировать изображения в Stable Diffusion 3 Искусственный интеллект, Креатив, Stable diffusion 3, Stable Diffusion, Digital, Длиннопост

Все просто, заходим на HG, выбирая любую нужную модель SD 3 — пишем промт и жмем Run — получаем генерацию.

Плюсы:

Как без регистраций и установок генерировать изображения в Stable Diffusion 3 Искусственный интеллект, Креатив, Stable diffusion 3, Stable Diffusion, Digital, Длиннопост

— одна из последних опенсоурс моделей Text-to-image на быстром оборудовании бесплатно воплощает ваши фантазии в Webp-картиночки;

— есть библиотеки пользовательских моделей, которые можно исследовать и подбирать под свои задачи;

— все это в браузере, и реально: без смс и регистраций даже.

Минусы:

Как без регистраций и установок генерировать изображения в Stable Diffusion 3 Искусственный интеллект, Креатив, Stable diffusion 3, Stable Diffusion, Digital, Длиннопост

— все еще не MJ даже предпоследнего поколения по качеству картинок;

— так как разворачиваетесь вы на чужом оборудовании и используете чужие билды, никто не гарантирует их долгое существование, но благо там вариантов много.

— web-версия модели не позволяет адаптировать ее и улучшить качество генераций за счет доработок билда.

Мнение:

Я попробовал генерации сравнить с MJ, да, разница огромна. Но, что интересно, где-то отдельные детали тот же SD понимает гораздо лучше MJ, например, стилистику картины Вильяма Бугро MJ слажала, так как у нее ближе к фотореализму, в то время как у SD было чуть более точнее.

Как без регистраций и установок генерировать изображения в Stable Diffusion 3 Искусственный интеллект, Креатив, Stable diffusion 3, Stable Diffusion, Digital, Длиннопост

Но по деталям и стилизации, понятно, что до MJ далеко, однако: всему свое время. Да и некоторые кастомные модели улучшают качество генераций в несколько раз, стоит поискать.

Взято из канала Верю только трендам. Там пишу больше о Digital, ИИ и маркетинге. Рассказываю как применять инструменты ИИ платные и бесплатные в работе. Буду рад видеть.

Показать полностью 4

Бесплатный доступ к GPT и его аналогам

Продолжу цикл постов о различных нейронках, которые могут пригодиться в работе, учебе и так далее.

Вообще, базово лучше использовать Chat GPT от OpenAi, он хорош по многим причинам, но не у всех есть возможность постоянно включать VPN или разбираться в способах оплаты. https://t.me/InTrendsWeTrust/482 — Тут я давал ссылку на бота, где лежит гайд по созданию своего GPT-бота прямо в Telegram. Это бесплатно и довольно просто и да, VPN не нужен. Кроме того, туда включена последняя модель GPT4-omni, которая себя неплохо показала в сравнении со своими конкурентами.

На различных биржах вы можете приобрести и готовый аккаунт и даже аккаунты с GPT+, если вам сложно оплачивать или разбираться. На таких биржах есть гарантии от продавцов или площадок, поэтому на них гораздо безопаснее проводить подобные сделки. Отдельно на таких маркетах можно найти и способы оплаты иностранных сервисов, включая HeyGen, ElevenLabs и т.д. Я это оговариваю, так как не все знают о подобных готовых решениях и зачастую перекупают отечественные аналоги, которые работают с доступ по API и ограничивают в токенах даже на платных тарифах.

Бесплатная версия GPT доступна и сейчас через авторизацию Google, например, однако как показывает практика, без VPN доступ есть не всегда.

Но поделюсь сегодня сервисами с LLM (большими языковыми моделями по типу GPT), для которых не нужен VPN или платный доступ.

https://labs.perplexity.ai/ — Платформа labs.perplexity.ai представляет свой интерфейс чат-бота, способного использовать разные опенсорсные модели, например LLAMA 3. Регистрации нигде не нужны.

Chatsonic - чат-сервис, основанный на языковых моделях ChatGPT 3.5 и ChatGPT 4. Он способен отвечать на вопросы, создавать подборки фактов на различные темы, помогать в написании деловых писем, постов для социальных сетей и описаний товаров.

Помимо функций чат-бота, Chatsonic включает в себя сервис Writesonic для написания статей объемом до 2000 слов. При необходимости он может также создавать иллюстрации, так как подключен к нейронкам Stable Diffusion и DALL-E.

YandexGPT. Эх, как всегда есть нюанс: “Новая модель доступна на платформе Yandex Cloud через API YandexGPT. Её можно попробовать в демо-режиме, для этого нужен только аккаунт на Яндексе”. Пока демо-режимы, говорить о полноценном доступе аналога GPT от Яндекса — сложно. Но можно потестировать под какие-либо задачи, если под рукой других возможностей нет, потому, что контекст на русском языке модель понимает иногда лучше чем даже ChatGPT версии 3.5 или 4.

Взято из канала Верю только трендам. Там пишу больше о Digital, ИИ и маркетинге. Рассказываю как применять инструменты ИИ платные и бесплатные в работе. Буду рад видеть.

Показать полностью
Отличная работа, все прочитано!