Когда в эпоху Возрождения завезли компьютеры, игры и зум
Создала серию нейрокартинок, где объединила стиль Ренессанса и современность. Продолжение на моем телеграм-канале 😉
Создала серию нейрокартинок, где объединила стиль Ренессанса и современность. Продолжение на моем телеграм-канале 😉
Dall-E 3 - новейший и недавно выпущенный генератор изображений от компании OpenAI, который благодаря своим впечатляющим возможностям набирает обороты в области ИИ. Это значительное улучшение по сравнению с предыдущей версией Dall-E, с лучшей согласованностью и качеством изображения.
Еще больше полезностей - в моем хобби-блоге про нейросети в Телеграм.
Но как Dall-E 3 выглядит в сравнении со своими ближайшими конкурентами - MidJourney 5.2 и Stable Diffusion XL?
В этой статье я сравню эти три модели, используя шесть различных промтов, чтобы выяснить, какая из них дает лучшие результаты.
Промт: An astronaut riding a steel horse on the moon. The astronaut is wearing a medieval armor with a party hat and a green sword.
Когерентность - одна из самых ярких особенностей Dall-E 3. В Dall-E 3 она реализована на все сто процентов, до мельчайших деталей. Остальные? Они немного забыли про настроение вечеринки (забыли про колпак и меч).
Промт: A dreamy landscape where clouds are made of cotton candy and rivers flow with liquid gold
В данном случае я хотел посмотреть, смогут ли эти модели искусственного интеллекта немного пофантазировать и внести разнообразие. Все дело в том, чтобы превратить безумие в "вау, как красиво".
По тому, как они получились, я бы сказал, что Dall-E 3 по-прежнему выглядит лучше всех из трех. Задавая сочетание узнаваемых элементов в непривычном виде, можно оценить, насколько хорошо каждый ИИ понимает и строит сцены с нуля.
Промт: Ancient Egyptian pharaoh using a modern smartphone while riding a dinosaur.
Так, результат MidJourney выглядит наиболее круто в этом примере, но в него не удалось включить древнеегипетского фараона. В этом раунде побеждает Dall-E 3.
В этом промте я хотел объединить разные временные периоды и проверить, насколько ИИ владеет исторической достоверностью, чтобы не допустить анахронизма. Хороший генератор изображений должен обеспечить сочетание, которое при этом будет выглядеть правдоподобно.
Промт: A portrait of a woman holding a wilted rose, her expression one of profound sadness and longing.
Это был тест на то, "можете ли вы вообще понимать чувства?". Ведь иногда дело не только во внешнем виде, но и в настроении. В этом раунде победил Stable Diffusion XL.
Этот промт проверяет способность ИИ передавать эмоции с помощью мимики и символических элементов, позволяя понять нюансы человеческих эмоций.
Промт: An image of a ‘thunderbird,’ a mythical creature that controls storms, depicted in its natural habitat during a fierce thunderstorm
Dall-E 3 был близок к победе, но трофей достался MidJourney. Птица была эпической, шторм был диким - это было целое настроение!
Этот промт требует творческого подхода к созданию несуществующих вещей, проверяя границы воображения ИИ. Кроме того, в задании используются элементы окружающей среды и погоды, добавляются слои сложности, и можно увидеть, как ИИ генерирует специальные эффекты (например, молнию).
Промт: Design an eco-friendly futuristic city floating on the ocean, with advanced technology and harmony between nature and artificial structures
В этой номинации победили все, но мне больше нравится вариант, созданный Dall-E2. Мягкие тона и симметрия элементов создают впечатление классного места, в котором хотелось бы жить.
Dall-E 3 теперь является частью ChatGPT и доступен только платным пользователям. Вы также можете использовать Dall-E 3 бесплатно в чате Bing, но я не знаю, как долго он будет бесплатным.
Единственным способом использования MidJourney в настоящее время является канал Discord. Щелкните на этой ссылке, чтобы присоединиться к каналу и начать создавать свои собственные образы AI.
Существует несколько способов использования Stable Diffusion XL, включая HuggingFace, ClipDrop и настройку на своем компьютере. Я рекомендую использовать Playground.AI для бесплатного использования SDXL.
Я впечатлен качеством изображений, создаваемых этими тремя генераторами AI-изображений, но у каждого из них есть свои сильные и слабые стороны.
MidJourney по-прежнему остается королем визуальной эстетики, создавая изображения, которые часто бывают потрясающими и креативными. Однако он может быть менее последовательным в плане согласованности, а также иногда создавать нереалистичные или нелепые изображения.
Dall-E 3 лучше, чем MidJourney, в плане согласованности, но его образы могут быть менее привлекательными. Dall-E 3 также лучше выполняет инструкции и генерирует изображения, соответствующие конкретным описаниям.
SDXL - хороший универсальный генератор AI-образов, но он отстает от MidJourney и Dall-E 3 как по визуальной эстетике, так и по согласованности.
В целом, я думаю, что выбор лучшего генератора AI-изображений будет зависеть от ваших конкретных потребностей.
Если вы не заметили, компания Adobe только что выпустила обновление своего собственного генератора AI-изображений под названием Firefly 2.0.
Я написал еще одну статью, в которой сравнил Dall-E 3 и Firefly. Adobe Firefly 2.0 - лучше ли он, чем Dall-E 3?
Еще больше полезностей - в моем хобби-блоге про нейросети в Телеграм.
Оригинал на английском языке
Специалисты по ИИ научились генерировать литературные произведения, которые очень сложно отличить от традиционных. Некоторые такие «книги» теперь входят в список бестселлеров на Амазоне и других площадках.
Например, Тим Бушэ «написал» с помощью ChatGPT 97 книг в жанре фантастики и заработал на них 2000 долларов. На создание одной книги у него уходит 6-8 часов. Тим собирается написать 1000 книг и увеличить доход в десять раз.
Те, кто ознакомился с трудами Тима, говорят, что это та ещё ахинея. Но копеечка капает.
———————————————————————————
Тут про бизнес👇
https://t.me/c/1842719333/123 —
(Личный источник)
Столкнулась с тем, что моих знаний в области ИИ не хватает, а всеведущая сеть интернет мне помочь не может. Надеюсь на совет от креативных пикабушников 🙏
Задача: Нужно сгенерировать некоторое количество картинок одного и того же персонажа по текстовому описанию в разных ракурсах и позициях на нейтральном фоне.
Все нейросети, которые я мучала на эту тему, могут генерировать только разных персонажей по описанию.
Думала также о том, что можно при помощи одного ИИ персонажа создать, а при помощи другого - "расшевелить", но не нашла подходящих сервисов.
Всю голову сломала, не знаю, как провернуть сию операцию. Буду рада любым подсказкам, чтобы понимать хотя бы, в какую сторону "копать" дальше.
Сама кодить не умею и возможности ставить на ПК тяжелые проги нет, к моему большому сожалению.
Спрашивала также у самих ИИ, но те ответ не дают, хотя промты были довольно детальными.
Вчера Кандинский обновился до версии 2.2. Решила сравнить его с предыдущей версией и заодно проверить, начал ли он догонять известную нейросеть Midjourney. Итак, спойлер: он пока еще не дотягивает до уровня Midjourney, но новое обновление вышло действительно интересным!
В обзоре буду сравнивать версии 2.1 и 2.2, используя один и тот же промпт. И чисто из интереса те же промпты выдам Midjourney.
Идеи для промптов брала на сайте Prompt Hero — постаралась выбрать разные тематики. Кандинский понимает запросы и на русском, и на английском, так что переводить их не стала.
Вот что пообещали разрабы:
Генерируемые изображения стали более фотореалистичными;
Теперь можно указывать соотношения сторон будущего изображения. Раньше генерируемые изображения были ограничены квадратным форматом 1:1;
Функционал ControlNet: он предоставляет вам возможность вносить локальные изменения на картинке без изменения всей сцены.
Решила начать с портретов, чтобы проверить, насколько изображения стали более реалистичными
a commercial photo portrait of stunning instagram model, sparklecore, appropriation artist, shiny/glossy, clear edge definition, unique and one-of-a-kind pieces, light brown and light amber, Fujifilm X-T4, Sony FE 85mm f/1. 4 GM
Кандинский 2.1 vs 2.2
Сразу заметна разница. Хотя с первого взгляда и видно, что это не фотография живого человека (либо сильно отфотошопленная версия), но результаты уже получше. Для сравнения вот такую фотореалистичность сейчас выдает Midjourney:
Не удержалась и решила провести эксперимент на Папе Римском. В этот раз обойдемся без переодевания его в белый пуховик (вы еще помните тот тренд с Баленсиагой?), а отправим его в Майами в 80-е годы.
Pope Francis in 80s Miami Style
Кандинский 2.1 vs 2.2
Вот тут вообще не впечатлило. Версия 2.1 получается даже более интересной и оригинальной. Да и цветовая гамма у нее сразу ассоциируется с розовым стилем и пальмами, о которых думаешь, когда слышишь о Майами 80-х. Версия 2.2 от Кандинского имеет излишнюю желтую насыщенность, это кстати сильный минус новой версии. Кажется, в 2.1 этого было меньше. Ну ладно, пойдем дальше.
Кстати, вот вам версия от Миджорни:
Несмотря на колоссальную разницу в качестве, 2.1 и Midjourney в общем-то попали в один вайб!
Ладно, давайте оставим фотореализм на время и сделаем что-то забавное и мультяшное. Вот промпт, который мы выбрали:
a cartoon of an astronaut in space full of other characters, in the style of dreamscape portraiture, youthful protagonists, dark cyan and bronze, vibrant murals, lit kid, photorealistic renderings, intricate underwater worlds
Кандинский 2.1 vs 2.2
Есть впечатление, что новая версия стала чуть более... скучной? Я пробовала этот промпт в разных стилях — и в мультфильме, и в аниме, и во всяких разных. Однако все равно получается некая «пустоватая» картинка с характерной засвеченностью. В общем, хочется снова отдать свой голос за предыдущую версию.
А вот Midjourney:
Как будто бы они тут с 2.1 опять мыслили в одном направлении. У Кандинского даже персонажи на заднем фоне повеселее вышли :)
Одно из интересных применений нейросетей — генерировать референсы для предметных съемок. Давайте попробуем создать рекламу бургера!
Flying food photography with a burger as the main theme, splash of toppings and spices, cheddar flavored cheese, onion, pickles, sesame Bun
Кандинский 2.1 vs 2.2
Опять же, версия 2.1 действительно проявляет больше фантазии, здесь и соусы, и кусочки бургеров. Зато вот у 2.2 получается гораздо реалистичнее.
И вот такой результат показывает Midjourney:
Давайте попросим нейросеть нарисовать для нас интерьер дома с большими окнами, открытой планировкой и использованием натуральных материалов.
open spaces that are arranged to be viewable, in the style of ludwig mies van der rohe, light brown and light amber, post-war french design, voigtlander brilliant, balcomb greene, use of common materials, windows vista
Кандинский 2.1 vs 2.2
Девиз 2.2: Еще больше желтизны богу желтизны...
Давайте еще раз вернемся проверить фотореалистичность. Хочется ленивца!
A photo of a cute sloth swimming in a river, summer day
Кандинский 2.1 vs 2.2
Ну, стало чуть более реалистично. Но все равно заметна повторяющаяся проблема с излишней насыщенностью.
Забавно наблюдать, как Midjourney и версия 2.1 выдают примерно похожие результаты:
В телеграм-боте Кандинского появились новые функции взаимодействия с изображениями, например возможность «смешивания». В этом режиме, по аналогии с функцией «remix» в Midjourney, вы можете загрузить изображение и написать тестовый промпт. Тогда нейросеть не только сгенерирует изображение, но и возьмет за основу загруженное изображение.
Решила поэкспериментировать с портретом девушки, который сгенерировала ранее, и в промпте написала всего одно слово: смокинг
Вышло интересно, вот это мне понравилось :)
Очень похоже на функцию смешения. Здесь вы можете использовать одно изображение в качестве основы и передать его стиль другому. Не нужно дополнительно писать, что вы хотите получить — нейросеть все сделает сама.
Нажала «смешать картинки» и получила это:
Функции смешения и переноса стиля тянут потестировать их еще. Можете загружать свои фотографии и использовать их в качестве основы для генерации других изображений с разными стилями. Поле для экспериментов огромное!
Выбираете соответствующую команду в меню тг-бота, вводите промпт, и получаете изображения, которые можно сразу же использовать для создания стикерпака прямо в телеграме:
Новые функции 2.2 мне зашли. В них не нужно долго разбираться да и проблем с ними не возникло.
Конечно, Кандинский, несмотря на свои достоинства, уступает Midjourney во многих аспектах. Но учтем, что Midjourney имеет больший объем данных для обучения — будем верить, что у Кандинского еще все впереди :D
Недостаток обновления, который сильно расстроил — «безликость» и желтизна получаемых изображений. Кроме того, несмотря на увеличение количества стилей до двадцати, разница между ними оказалась не всегда заметна и особого восторга не вызвала.
Как вам обновление? Успели затестить?
Источник: Нейросекта
Я пообещала @book.worm, запилить этот пост, поэтому вот он.
Итак, меня зовут Ульяна и я алкоголик пишу ромфант. Многие обвиняют иной раз вполне заслуженно авторов любовного фэнтези в полном отсутствии вкуса, знаний элементарной физики и биологии проработанного мира. Что ж, зачастую так бывает, но я решила заморочиться и сделать то, что никому нафиг не сдалось, потому что ЦА больше любит брызги эмоций, создать настоящий мир, со своими легендами, сложными политическими и товарными отношениями, богами и магическими животными. А потом всё это ещё и проиллюстрировала с помощью нейросетей.
Итак, в Карастели 3 материка, каждый со своими климатическими особенностями и видами животных. Начнём с того, что привычной нам зелёной зелени там нет, вместо неё на планете царит багряная растительность от ярко-алого до фиолетового. Поначалу такие пейзажи вызывают оторопь, но со временем к бордовым лесам привыкаешь и даже находишь в них свою кровавую прелесть.
Как у любого уважающего себя мира, у Карастели есть карта. На Северном Плато обитают кланы, на юге -- минхи, а главный материк делят три страны, Альмендрия с парламентской монархией, Шемальяна с властью аристократии и жёсткой стратификацией общества и космополитичный Ковен, город-государство магов.
На континенте в ходу три язка -- общий для всех и альмендрийский с шемальянским, изучение которых могут себе позволить лишь элиты.
В этом мире народы говорили на разных языках, но затем боги одарили людей возможностью изучать язык с помощью магии. Поначалу такой общий язык стал средством общения для магически одарённых, которые далеко не всегда были выходцами из элит. Постепенно общий вытеснил самобытные языки из-за грамматической простоты, удобства и возможности обучиться чтению и письму за плату. На данный момент большинство населения говорит на общем, но в каждом регионе есть свои диалектические особенности и названия.
В мире Карастели есть боги. Они присутствуют в жизни людей, но при этом запрещают себе молиться, взывать и строить храмы. Богам в целом плевать на жизни конкретных людей и магов, их волнует только безопасность/целостность мира, и они "приглядывают" за населением, но не вмешиваются напрямую. Призывы и молитвы их откровенно раздражают и причисляются к "нытью", за которое посмевший потревожить божественный покой жестоко карается. Иногда смертью, чтобы другим было неповадно.
Цитата из романа на эту тему:
— Боги не любят, когда их беспокоят, и предпочитают приходить сами. Каждый первый день сезона они снисходят в капильи и благословляют браки. Поэтому в Карастели женятся лишь четыре дня в году. Так удобнее всевышним. Вообще, богов можно и призвать, но за каждый вызов они берут кровавую жертву, чтобы их не дёргали понапрасну.
— Человеческую?
— Да. При этом выбирают на своё усмотрение. Есть легенда о юной Анадае. Она призвала богиню, чтобы та исцелила её раненного в бою возлюбленного. Среди бойцов и невольных свидетелей драки не оказалось ни целителя, ни мага, умеющего ходить порталами. Юноша умирал. Девушка воззвала к Триединой и попросила излечить своего любимого.
— И что было дальше?
— Богиня рассердилась, но просьбу выполнила. А потом забрала обе их жизни. Ведь Анадая попросила только вылечить возлюбленного и предлагала взамен что угодно. Триединая вылечила парня и забрала их обоих в качестве платы за беспокойство… Боги почти никогда не помогают людям.
— Но почему?
— Им всё равно. Жизнь человека слишком коротка, чтобы иметь хоть какую-то ценность для Всевышних. Они вмешиваются лишь тогда, когда опасность угрожает миру целиком. В остальном же предпочитают не действовать напрямую, а насылать сны или давать подсказки. И если ты подсказку не понял или понял не так, то сам виноват.
— Жестоко.
— Жизненно. Ребёнок не научится есть сам, если мамочка всё время будет кормить его с ложки. Все в Карастели знают: у богов — божественное, у людей — людское.
Не все животные в этом мире обладают магией, но такие встречаются. Например, на севере обитают дикие и крайне опасные хищные ирреты, чем-то напоминающие полярных медведей и не возражающие полакомиться человечинкой. Они способны сражаться магически, и охотники на ирретов часто гибнут в этих стычках. Но белый удивительный мех, кости и клыки слишком ценны, чтобы не попытать удачу.
В лесах Шемальяны обитают лискари́ — зверьки своенравные и своевольные, любят магию, вкусно поесть и порезвиться. В неволе не живут и не размножаются, отчаянно мстят пленителям, но если уж выбрали себе компаньона (не хозяина!), то будут с ним до самой смерти. При этом оставляют за собой право порой исчезать на пару дней по своим лискаря́чьим делам. Пары они образуют один раз на всю жизнь, детёнышей выводят только с одним партнёром, очень лояльны и к людям, к которым привыкают. На лица у них, кстати, отличная память, а вернее злопамятность.Им требуется энергетическая подпитка, поэтому жить предпочитают возле естественных источников магии или рядом с колдунами. Редкие, жутко дорогие и очень милые. При этом в бою могут и магией шарахнуть, и в горло вцепиться — существа они отнюдь не беззащитные, длинные и изогнутые когти и бритвенно острые клыки делают их прекрасными охотниками и защитниками.
Порталы и магия в пределах мира работают с условиями. Например, перемещение между континентами даётся только очень сильным магам. Магия делится на шесть стихий: Свет, Тьма, Вода, Огонь, Земля, Воздух. У каждого вида магии есть свои ограничения и особенности, но про это тут долго писать, поэтому вернётся к иллюстрациям.
На небосводе Карастели две луны. И двойное полнолуние -- это большая редкость и событие планетарного масштаба.
Мир Карастели -- это не средневековье, а скорее 19й век со своими особенностями и условностями. В городских имениях элиты давно есть канализация и водопровод, а некоторые северные кланы до сих пор живут в шатрах из шкур. Уровень цивилизации крайне разнообразен, где-то стирают руками в холодной воде, а где-то используют маготехнологии, артефакты-нагреватели и опреснители воды.
Одним из самых красивых мест мира считаются розовые пляжи Итари, где лиловые рощи спускаются к кромке воды. Романтическое место для отдыха, большинство богачей имеют там если не имения, то хотя бы небольшие домики. Цвет песка связан с красными и пурпурными моллюсками, которые обитают в тех водах.
Действие романов происходит в разных городах и странах.
На юге расположен материк Минхатеп, пустынный и суровый. Там расположены солёные озёра, и пальмовые плантации. Минхатеп -- основной поставщик стекла, соли и сахара в мире. Альмендрийцы торгуют мукой, злаками, рудой и оружием. Их рудники известны даже за пределами Карастели, ибо там добывают крайне любопытные минералы и металлы. В Шемальяне расположена большая часть текстильных производств, они также производят верёвки и канаты, что пользуется большим спросом, ведь по морю передвигаются на парусниках. На Севере выращивают шерстистых овец, разводят мехотрясов и добывают шкуры различных животных. Кланы известны выделкой кожи и качеством лёгких доспехов.
Или, например, вот Ковен. В этом городе живут и работают в основном магически одарённые. Остальные нанимаются на службу по контракту. Основные статьи экспорта -- магические артефакты, книги, зелья, улучшенные магией товары. Так же в Ковене находится Школы Магического Мастерства и Институт Практической и Теоретической Магии, где можно обучаться как платно, так и бесплатно с обязательной отработкой. Ковен особенен архитектурой: визитной карточкой города являются голубоватые и синеватые здания.
Все иллюстрации сгенерированы (и подправлены фотошопом) мною, с помощью нейросетей Далл.е и Мидджорни.
В пост вошли только некоторые иллюстрации, но пусть остальные особенности/красоты останутся сюрпризом для тех, кто решит почитать саму серию. Кстати, все романы в цикле -- отдельные истории, можно начинать хоть с последнего, но хронологически первым был вот этот. Вот одна из иллюстраций к нему.
"Нейронные сети каждый день осваивают новые функции – то заменят лицо Джулии Робертс на гримасу Уиллема Дефо в кадрах из «Красотки», то в порно любимого актера публики подставят. Словом, развлекайся – не хочу. Однако немец Фабиан Штельцер решил пойти дальше: в его руках искусственный интеллект создаст целый фильм. Одна нейросеть будет формировать изображение, другая создаст спецэффекты, третья – озвучит персонажей. При этом в кадре будет звучать исключительно голос самого Фабиана, конечно, измененный при помощи ИИ"
Ссылка на пост: https://kinoreporter.ru/ai-created-movie/
Несколько лет назад возникла у меня идея в дорисовке старых и любимых наших фильмов из формата 4:3 до "широкоэкранных" 16:9 fullHD. Чтоб приятнее глазу было смотреть на современных TV. Ведь давно уже как научились делать раскадровку с чисткой и улучшением картинки, нужно лишь изменить размер кадра и "дорисовать" логичным по смыслу и по содержанию деталями из текущего кадра . Теперь с нейросетями такое уже возможно. Кто б услышал...