Luma ИИ
Перестаньте калечить и бесить нашу психику этим говном. Задрали раздражать. Художники и фотографы - я с вами.
Липсинк нового уровня
🌟Вышла крутая бесплатная модель HEDRA.COM которая оживляет картинки.
😱С учетом того что ничего не нужно скачивать, можно наложить музыку и выбрать голос — это просто бомба.
🤔Тут нет Russian голосов в списке, однако результаты и без этого получаются прикольными.
Дневник стартапа #9: ИИ-ассистент на собственной базе знаний, генератор промптов и брендированные селфи
Привет, это Настя, руководитель отдела контента в Aigital — сервисе на основе нейросетей для решения маркетинговых задач. Мы придумываем и разрабатываем шаблоны, которые упрощают пользователям создание контента для рекламы, СМИ и соцсетей. Каждую неделю мы пишем о развитии стартапа и изнанке продукта.
В этом выпуске расскажем о нашем ИИ-ассистенте, который помогает формулировать промпты и работает на собственной базе знаний. Также подробно разберем, как и зачем превращать клиентов в лица вашего бренда.
ИИ-ассистент со своей базой знаний
Когда мы выпустили первых ИИ-ассистентов, увидели, что нам не хватает главного — помощника в работе с нейросетями и с нашим сервисом. Мы назвали его ИИ-гид и запрограммировали помогать пользователям писать промпты. Но в процессе разработки поняли, что он также может подсказывать пользователям, как решать задачи с помощью Aigital.
Как работает
Как и всем нашим ассистентам, мы прописали ИИ-гиду сложную роль: специалиста в области ИИ, промпт-инженера, компетентного в области обработки естественного языка и машинного обучения. Он хорошо знаком со спецификой работы различных ИИ-моделей. Задача ассистента — консультировать различных специалистов в том, как ИИ может помочь в их повседневных задачах.
Например, продакт-менеджер может спросить его, как использовать нейросети в своей работе, и ассистент объяснит, какие задачи можно делегировать искусственному интеллекту.
Если попросить ИИ-гида помочь с промптом для текста или картинки, он пропишет подробный промпт с учетом особенностей взаимодействия как с LLM-ками, так и с графическими моделями. Он обучен на примерах наших промпт-инженеров.
Так, например, если пользователь просит написать промпт для генерации изображения, он пропишет передний и задний план, особенности композиции и настройки камеры. Для LLM-модели он задаст роль, компетенции, подробно опишет задачу и ожидаемый результат.
В ассистенте прописан стиль общения: он должен быть дружелюбным, заботливым и заинтересованным в решении задач пользователя. Мы просим его общаться профессионально, избегая жаргонизмов, как если бы он советовал что-то другу или коллеге.
Особенность этого ассистента в том, что при поиске ответа он обращается к нашей базе знаний. Можно попросить ИИ помочь решить конкретную задачу в Aigital.
Например, я спросила ИИ-гида, как вывести новую коллекцию товаров на рынок с помощью Aigital, и он подсказал ассистентов и навыки, которые помогут в этом.
ИИ-гид с опорой на нашу базу знаний по навыкам — это большой шаг к созданию персональных корпоративных ИИ-ассистентов. В первую очередь они будут доступны компаниям, которые используют Aigital как внутреннюю корпоративную платформу.
Аватарка с помощью нейросетей
Мы обновили навык «Аватарка» — маркетинговый инструмент для создания персонализированных брендированных картинок. У него изначально был крутой потенциал, но качество генераций нас не устраивало, поэтому тестировали разные модельки.
На этой неделе пересобрали цепочку моделей, и теперь навык лучше передает как задумку пользователя, так и черты лица с фотографии. И прежде чем перейдем к техническим подробностям, давайте обсудим, зачем в маркетинге и продажах генерировать аватарки.
Во-первых, с помощью этой технологии гораздо проще обновлять визуальный контент. Достаточно загрузить фотографию и описать роль, которую будет играть этот человек. Так можно сделать лицом своей рекламной кампании сотни покупателей, чтобы быть ближе к аудитории и создать более крепкую эмоциональную связь с брендом.
Также вы можете персонифицировать свой бренд, сгенерировав персонажа в навыке «Фотосток: Люди», чтобы использовать его для рекламных креативов, баннеров и контента в соцсетях. Например, фото для своих ИИ-ассистентов мы сгенерировали в навыке «Фотосток: Люди», а с помощью «Аватарки» можем представлять их в разных образах на сайте и в телеграм-канале.
Как работает
Создание аватарки состоит из 7 этапов.
В интерфейсе сервиса пользователь добавляет фото и пишет текстовый запрос, по которому будет генерироваться картинка.
Чтобы черты лица на картинке были больше похожи на оригинал, загружайте фотографии анфас, без дополнительных аксессуаров вроде солнечных очков.
Полученный текстовый запрос нейросеть переводит на английский язык.
В это время GPT-4 Vision анализирует загруженную фотографию, определяет:
• пол;
• расу;
• цвет глаз;
• цвет кожи;
• форму губ;
• овал лица и другие детали.
Это сканирование и изучение фото позволяет сгенерировать аватарку максимально похожей на оригинал. Без Vision можно получить изображение человека другого пола, с другим цветом кожи или иными чертами лица.
Vision выдает текстовое описание лица, которое объединяется с пользовательским запросом. Здесь же прописываются дополнительные параметры для генерации качественного фотореалистичного изображения.
Затем этот промпт передается в графическую нейросеть Fooocus, настроенную генерировать реалистичные портреты. Она создает фотореалистичное изображение по пользовательскому запросу с персонажем, по описанию похожим на человека с фото.
На следующем этапе происходит замена лица. С помощью технологии Face Swap лицо на сгенерированной картинке меняется на лицо с фотографии.
Новости проекта
На этой неделе база Aigital преодолела гигабайт сгенерированных пользователями данных. Это зашифрованные результаты генераций в различных навыках. Благодаря базе пользователи могут обращаться к истории генераций и возвращаться к своим постам в соцсети, статьям, рекламным креативам и прочим наработкам. Год назад этот объем казался нам нереальным.
Работаем над онбордингом и полезными материалами об ИИ, которые будут доступны прямо на платформе.
Готовим к выпуску транскрибатор и саммаризатор аудио- и видеозвонков. Уже испытали на своих созвонах, чуть-чуть допилим и добавим на платформу.
На следующей неделе расскажем о бизнес-кейсе и ИИ-ассистенте «Креатологе», которых выбрали читатели предыдущих дайджестов.
Предыдущий выпуск дневника можно почитать по ссылке.
А промокод DIGEST_2306WN! открывает все навыки, доступные в платной версии до 23.06.
Песня Винни-Пуха [Cloud Rap AI-Cover]
Ну прям типичный русский рэп вышел!
Ответ на пост «"Всадница" Брюллова»
Решил сравнить, как genmo ai картинки оживляет:
Боитесь своих внутренних демонов?
Представьте, что каждый ваш страх — это невидимый монстр в бесконечном доме. Сможете ли вы найти выход и освободиться? Сегодня есть возможность узнать ответ — в нашей новой игре!
Нейросети совсем скоро нас заменят...
Ну или нет. Скоро контрольная по Теории вероятности и мат. статистике, единственное, что осталось закрыть из тем - непрерывная случайная величина. Смотрел уже по готовым решениям, но так и не понял как решать, уж слишком отличается от дискретной. Единственное, что осталось, как разобраться с НСВ - пойти и спросить у нейросети, на что получил достаточно прорывной ответ:
Мало того, что нейросеть сама ошиблась и начала переписывать (с кем не бывает), так еще и начала путаться со своими же командами для красивых выражений. Такое не может не пробивать на смех. И да, сайте снизу написано, что нейросеть может ошибаться. Но не четыре раза подряд, так еще с двумя-тремя перевычислениями.
Для контекста, нейросеть на генерации, самая "навороченная" - chatgpt-4o.
В общем, далеко им еще до того, чтобы людей заменить.