Быстрый Брендинг на грани
Тематический выпуск в честь грядущего Всемирного дня бега
Сбрендил для вас,
Антон Логотиппер
Мои сообщества:
Telegram Брендинга на грани
ВК Брендинга на грани
Telegram Logotipper.Agency
ВК Logotipper.Agency
Тематический выпуск в честь грядущего Всемирного дня бега
Сбрендил для вас,
Антон Логотиппер
Мои сообщества:
Telegram Брендинга на грани
ВК Брендинга на грани
Telegram Logotipper.Agency
ВК Logotipper.Agency
Привет, это Настя, руководитель отдела контента в Aigital — сервиса на основе нейросетей для решения маркетинговых задач. Мы придумываем и разрабатываем шаблоны, которые упрощают пользователям создание контента для рекламы, СМИ и соцсетей. Каждую неделю мы рассказываем о развитии стартапа и изнанке продукта.
Сегодня расскажу о создании Customer Journey Map (CJM) с помощью нейросетей, обновленном инструменте для удаления фона и генерации картинки на основе другого изображения.
На этой неделе мы добавили на платформу новый навык — генерация картинки на основе другого изображения. С помощью этого навыка можно решать множество прикладных задач: от генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей. Он учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации. Помимо этого навык учитывает и то, что указано в текстовом промпте.
Например, в поле «Референс» вы добавляете картинку — обложку с любого YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете картинку с шашлыками, подходящую по тематике для вашего блога, а по стилистике, палитре и композиции похожую на изображение, что вы добавляли в качестве референса.
Генерация изображения в навыке «В стиле референса»
Под капотом навык работает следующим образом:
На первом этапе ИИ анализирует референс — GPT-4o подробно описывает картинку с разных сторон, прорабатывает её стилистику.
В параллель с этим другая нода GPT-4o берет текстовый запрос пользователя и переводит его на английский.
На следующем шаге GPT формирует объемный промпт, объединяя описание референса и текстовый запрос пользователя. Веса в нем расставлены так, чтобы нейронка понимала, на что следует обратить больше внимания, а на что меньше.
Этот текстовый промпт отправляется в Fooocus.
Fooocus умеет работать с входящими изображениями, поэтому вместе с текстовым промптом приходит и картинка-референс. Получается двойной удар по задаче — и со стороны текстового описания референса, и визуально — с ориентиром на само исходное изображение.
Fooocus сохраняет не только цветовую палитру, но и пропорции картинки-референса. Это особенно удобно, если требуется определенный размер изображения.
Генерация изображения в навыке «В стиле референса»
Картинка-референс (первое изображение) и результат генерации по референсу и описанию (второе изображение)
Далее обученная нами модель улучшает черты лица на картинке и передает ее пользователю.
Мы решили поэкспериментировать и сгенерировать стол со стульями на основе скрина нашего лендинга. Нейронка сохранила пропорции, забрала темно-серый на фон, а зеленый и белый в акценты.
Скрин нашего лендинга
Изображение сгенерировано в навыке «В стиле референса»
Навык «Путь пользователя» или Customer Journey Map для сегодняшнего разбора выбрало большинство читателей пятого дайджеста.
CJM — это карта пути клиента, которая показывает все этапы взаимодействия пользователя с продуктом или услугой. Она помогает понять, как клиент воспринимает ваш продукт, какие у него возникают вопросы и болевые точки на каждом этапе.
В этом навыке Aigital выступает в роли специалиста по CJM, глубоко знающего психологию, маркетинг, продуктовую разработку.
Перед тем как приступить к разработке карты пути клиента, важно четко понять, кто будет использовать ваш продукт и каковы их цели. Для этого нужно описать сам продукт, услугу и пользователя. Если у вас еще нет четкого представления о пользователе, можно воспользоваться навыком «3 портрета пользователя». В результате вы получите подробные портреты пользователей с учетом их дохода и психографики (интересов и взглядов) на основе описания вашего продукта.
В основу промпта лег фреймворк по Customer Journey Map от нашего продакт-менеджера Юры. Одна из компетенций Юры — как раз создание CJM.
Вы можете забрать этот фреймворк в Figma-комьюнити и использовать для презентации своей команде сгенерированный в Aigital CJM.
CJM должна включать не только общие этапы взаимодействия с продуктом, но и детализацию каждого шага. Подробный ответ генерируется под каждый шаг CJM, чтобы детальнее проработать задачу. Шаги пользователей, которые сейчас учитываются в навыке:
Онбординг (Onboarding) — первое взаимодействие клиентов с продуктом или услугой, знакомство с основными функциями и преимуществами.
Обзор ценности (Value Discovery) — глубокое изучение продукта или услуги, понимание его уникальной ценности и соответствия потребностям.
Рассмотрение вариантов (Consideration) — оценка плюсов и минусов продукта или услуги, принятие решения о покупке.
Покупка (Purchase) — процесс покупки.
Формирование привычки (Habit Formation) — включение продукта или услуги в повседневные привычки, развитие лояльности.
Распространение (Advocacy) — рекомендация продукта или услуги.
Наш сервис генерирует подробное описание каждого шага, отмечая следующее:
Какой цели я хочу достичь на этом этапе?
Какие действия мне нужно предпринять для достижения цели?
Какие трудности могут возникнуть?
Какие вопросы или сомнения могут появиться?
Где я могу ошибиться?
Что мотивирует меня двигаться к цели?
Какие эмоции я могу испытывать на этом этапе?
Отдельным пунктом в каждом шаге прописываются возможности для улучшения пользовательского опыта. В промпте для этого навыка мы прописываем, что CJM создается, чтобы повысить вовлеченность и снизить отток пользователей.
Наш фреймворк близок к маркетинговой воронке, но поскольку видов CJM довольно много, мы не хотим ограничиваться одним. Поделитесь в комментариях, какие шаги проходит ваш клиент, взаимодействуя с продуктом? В этом навыке мы планируем сделать выпадающее меню с выбором типа CJM.
Еще немного о том, какие изменения в сервисе мы реализовали или готовим в ближайшее время.
Обновили «Удаление фона». Новый инструмент, на котором работает навык, очень быстро и гораздо качественнее отрабатывает задачу. Особенно это заметно на мелких деталях, например, на волосах.
Обратите внимание на волосы девушки
В раздел истории списаний добавили названия навыков, в которых происходили генерации. Теперь стало удобнее отслеживать, сколько вы расходуете кредитов на те или иные генерации.
Результаты генерации в текстовых навыках теперь приходят с форматированием — подзаголовки в них выделены жирным, маркированные списки аккуратно оформлены, если позволяет задача — добавлены эмодзи. Кроме того, теперь вы можете получать результат в виде таблички, достаточно указать это в пункте «Что учесть» или в своем запросе.
Надеемся, вы уже успели протестировать «Маркетологуса» и «Чат с ИИ». Мы готовим к релизу 10 новых ИИ-ассистентов, среди них будут эксперты по HR, SMM и SEO.
Предыдущий выпуск «Дневника стартапа» читайте здесь.
Сгенерировано за 2 секунды и за 6 шагов на TCD
Друзья, всем привет! Недавно популярный нейросетевой интерфейс Fooocus обновился сразу до версии v2.4.1. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Давайте посмотрим, какие основные нововведения и улучшения появились. Я отдельно озвучу самые заметные обновления и оставлю полный список изменений в конце.
Добавился новый режим Hyper-SD, это еще одна лора чтобы генерировать за 4 шага в ущерб качеству, кому-то пригодится, работает не хуже чем лайтнинг.
Aspect Ratios - разрешения теперь зачем-то свернуты, меня лично это бесит, это не красиво и не удобно.
Random style - случайный стиль при каждой генерации будет включать - случайный стиль, если вам совсем нечем заняться, не забудьте выставить на максимум количество изображений.
На вкладке Debug Menu в разделе Inpaint вы найдете Inpaint brush color, на тот случай если вас всегда бесил белый цвет маски.
Там же в Debug Menu, но уже в разделе Debug Tools появился параметр CLIP Skip, который по умолчанию выставлен на 2, имейте это ввиду.
Там же добавились семплер и планировщик TCD, которые запрашивал ваш покорный слуга. Сначала скачайте и включите вот эту лору, затем в Debug Menu, в разделе Debug Tools поставьте на 1 CFG Mimicking from TSNR, затем Sampler поставьте TCD, а Scheduler - sgm_uniform, ниже Forced Overwrite of Sampling Step поставьте на 6, я нашел это оптимальным значением для соотношения скорость - качество, но вы конечно можете поэкспериментировать и написать в комментариях как работает лучше. Guidance Scale рекомендуется поставить на минимум, но я нахожу что на 1.5-2 изображения получаются интереснее. Изображение с обложки было создано именно в таком режиме всего за 6 шагов и за 2 секунды в разрешении 1280х768, а так и не скажешь. Еще несколько изображений в карусели ниже.
Изображения созданы в TCD
Добавлена возможность загружать файлы с Hugging Face через зеркальный сайт.
Обновлен модуль Interposer с v3.1 до v4.0.
Теперь можно переподключиться к интерфейсу без перезагрузки страницы с помощью специальной кнопки.
Появился выбор VAE моделей для генерации.
Добавлен новый стиль "Random Style" для случайного выбора стиля.
Обновлена модель аниме с animaPencilXL_v100 до animaPencilXL_v310.
В историю логов теперь сохраняются полные необработанные промпты (full raw prompts).
При загрузке изображения для апскейла (upscaling) теперь можно автоматически получить его описание.
Добавлена цензура NSFW изображений (отключает предварительный просмотр промежуточного изображения при генерации). Установите значение конфигурации default_black_out_nsfw в True, чтобы всегда включать эту опцию.
Добавлена поддержка встроенных ссылок на LoRA в промптах с поддержкой подпапок, пример: colorful bird lora:toucan:1.2
При описании изображения теперь даются рекомендации по размеру и соотношению сторон.
В инструменте инпейнтинга появился выбор цвета кисти, что удобно, когда изображение и кисть маски имеют одинаковый цвет.
Автоматизирована сборка Docker-образа с помощью Github Actions при каждом релизе.
Планировщики и семплеры:
Добавлен планировщик AlignYourSteps от Nvidia.
Добавлены семплер TCD и планировщик, основанный на sgm_uniform (аналогично lcm).
Производительность:
Добавлена производительность "hyper-sd" на основе 4-шагового LoRA.
Исправления:
Исправлено значение clip skip по умолчанию с 1 на 2.
Добавлена проверка типов на неопределенные значения, использование резервных вариантов, когда нет перевода для соотношений сторон.
Использовано корректное свойство CSS border-radius.
Исправлен незакрытый мета-тег в заголовке HTML.
Удален оставшийся код для тестирования hyper-sd.
Оптимизировано управление моделями для цензуры NSFW изображений.
Улучшена панель прогресса генерации.
Оптимизирована работа со встроенными LoRA.
Настройки интерфейса:
Элементы вкладки настроек стали более компактными.
Добавлен слайдер clip skip.
У большинства полей ввода изображений удалены подписи.
Настройки пользовательского интерфейса стали более компактными.
Прочее:
Изменен владелец кода с @lllyasviel на @mashb1t для автоматического уведомления о проблемах и Merge Requests.
Используются только действительные встроенные LoRA, добавлена поддержка подпапок.
Значение 'CFG Mimicking from TSNR' теперь читается из пресетов.
Изменена конфигурация окончания строк по умолчанию.
Оригинальный список изменений доступен на странице автора.
Скорее всего обновление уже произошло автоматически когда вы запускали фокус и никаких специальных действий не требуется. Если в консоли вы видите Already up-to-date, то можно не беспокоиться.
Но в моем случае была вот такая ошибка и я не нашел иного решения как просто скачать новый установщик и после этого все прошло гладко.
А если захотите изучить Fooocus профессионально, то приглашаю на мой курс Fooocus.ru, где за 15 уроков вы узнаете всю базу необходимую для дальнейшего развития.
Пройдя этот тест, вы узнаете, сколько нужно сосисок, чтобы спуститься по ним на дно Марианской впадины. А еще сколько их можно съесть, пока длится самый долгий в мире поцелуй. Не пропустите!
Проект Verlab, используя искусственный интеллект, создает элементы декора интерьера, вдохновленные русским искусством.
Дизайн диванов вышел по-своему "сладким".
Наткнулся тут на одну картинку и мозг сразу такой "чё та тут не то...", пригляделся, и правда - это ж одна из невозможных фигур, но аффтырь сего чуда, пишет мол "купите стандартных брусков в магазине и вы легко это сделаете!". Ню - ню... ;) Дезигнеры-снежинки атакуют.
Нейросеть попросил изобразить цветочек с божьей коровкой )
Мне кажется она мне что-то хочет сказать...
Пришло мне в голову заебенить организовать портрет кошки в виде интерьерной картины на кухню. Сюжет - кошка в ресторане пьёт вино. Пару лет назад с такой идеей пришлось бы обещаться к специалистам. А сейчас - загрузил фотки питомца в качестве визуального промта и спустя десяток генераций получил результат в высоком разрешении.
Исходники:
Результат
Не портретное сходство, но и смысл не в этом.
Осталось закончить ремонт на кухне и картина займёт свое место
Некоторые концепты должны оставаться в виде красивых картинок.
Другие концепты на канале: t.me›s/vot_tak_nado