RASKALOF

RASKALOF

Немного рисую нейронкой.
На Пикабу
поставил 27 плюсов и 9 минусов
отредактировал 0 постов
проголосовал за 0 редактирований
Награды:
5 лет на Пикабу
1125 рейтинг 7 подписчиков 2 подписки 34 поста 10 в горячем

Вк как всегда

Тут должно быть видео, но его не будет, так как обосраный вк при экспорте видоса выдает собаку усераку вместо видео

LINDEMANN_AI поет песни на русском языке

Привет, моя модель голоса Тилля Линдеманна для so-vits-svc поет песни на русском языке

Золотые купола (Михаил Круг)

Горький вкус (Султан Лагучев)

Щемит в душе тоска (Многоточие)

Фантазер (Ярослав Евдокимов)

Еще больше у меня в группе: https://vk.com/neuromaniacss

Показать полностью 3

LINDEMANN_AI поет песни Агаты Кристи

Привет, моя модель голоса Тилля Линдеманна для so-vits-svc поет песни Агаты Кристи

Черная луна

Опиум для никого

Еще больше у меня в группе: https://vk.com/neuromaniacss

Показать полностью 1

Тилль Линдеманн - Вальс Бостон (AI cover)

Я сделал модель голоса Тилля Линдеманна для so-vits-svc, как вам?

Еще больше нейрокаверов у меня в группе: https://vk.com/neuromaniacss

Лучшая Ai upscale модель для изображений [Stable Diffusion]

Всем привет, решил провести небольшой эксперимент и выяснить, какая модель апскейлинга лучше всего подходит для реставрации артов/комиксов и т.д. Текста будет много, как и примеров, так что кто пришел за быстрым ответом - сорян.
Также, представленные далее изображения не подходят для детей!

Мой PC:
ОС: Microsoft Windows 10 Pro x64
CPU: OctalCore Intel Core i7-11700KF, 4700 MHz (47 x 100)
Motherboard: Gigabyte Z590 Aorus Pro AX
RAM: 16256 МБ (DDR4 SDRAM)
GPU: NVIDIA GeForce RTX 3060 (12 ГБ)

Stable Diffusion (Automatic1111):
version: v1.3.2
python: 3.10.6
torch: 2.0.1+cu118
xformers: 0.0.17
gradio: 3.32.0

Начальные данные:

Исходное изображение (взято из свободных источников для ознакомления и цитирования):

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

Технические данные:
Разрешение: 1600x1270 (немного отличается от того, что прикрепил, т.к. обрезал рекламу)
Расширение: jpg
Апскейлинг до 6400x5080 (x4)

Модели апскейлинга:
ScuNET GAN
ScuNET PSNR
SwinIR 4x
4x-UltraSharp
R-ESRGAN 4x+ Anime6B
R-ESRGAN 4x+
Lanczos
Nearest

ЭКСПЕРИМЕНТ:

После прогона через все модели получил такие данные:

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

Выкладывать готовые полноформатные изображения не буду, чтобы не захламлять пост, вместо этого, в каждом результате я вырезал по 4 одинаковых кусочка 1024x1024, чтобы поближе их рассмотреть и сравнить. Буду выставлять по каждой категории сэмплов галочку той модели, которая на мой взгляд справилась лучше всех.

Оговорюсь, что я буду описывать только 4x UltraSharp, R-ESRGAN 4x+ Anime6B, R-ESRGAN 4x+, SwinIR 4x, так как остальные модели выдают плюс-минус одинаково паршивый результат и ковырять их смысла не вижу, если надо - можете сами посмотреть и оценить.

Поехали:

Сэмпл 1:

В оригинале баки, шерсть и зубы плохо читаются, все изображение пикселизовано, присутствуют артефакты jpg. Далее оригинал не буду описывать, можете посмотреть исходное изображение и понять насколько там все плохо.
Также, стоит делать скидку на то, что пикабу, скорее всего, пожмет качество и то, что видите вы, не совсем то, что вижу я.
Поэтому, можете скачать исходники сэмплов тут: https://disk.yandex.ru/d/55idZOxfaHEAMA

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

4x-UltraSharp:
Плюсы: все читается, четкие контурные линии, нет артефактов, зубы хорошо различимы, баки и волосы на плече хороши. Самое важное - стиль сохранен.
Минусы: баки частично срезаны слева, на правой части зубов вылез артефакт в виде линии.
R-ESRGAN 4x+ Anime6B:
Плюсы: в целом выглядит очень вкусно, контурные линии - лучшие среди всех результатов, нет артефакта на зубах. Кожаный костюм выглядит лучше, чем в других результатах.
Минусы: баки превратились в пенку, волосы на плече стали рваной кожей, стиль не сохранен, все стало слишком прилизанным, восковым, потерялись мелкие детали. Стиль уходит в аниме.
R-ESRGAN 4x+:
Плюсы: самый сбалансированный результат, нет артефактов, хорошие линии, баки не мыльные, но слишком реалистичные, выбиваются из общего стиля.
Минусы: кожаный костюм местами стал словно шерстяным, не критично, но немного некорректно, все элементы читаются хуже, чем у моделей выше. Стиль уходит в реализм.
SwinIR 4x:
Лучший и самый сбалансированный вариант, баки, волосы, костюм, все выглядит максимально хорошо и сбалансированно.

Вердикт:
Выбираю SwinIR 4x именно из-за баланса и отсутствия вольных изменений и интерпретаций.

Сэмпл 2:

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

4x-UltraSharp:
Плюсы: голова справа получилась лучше всех.
Минусы: цепь на шее вампира слева превратилась в греческий узор, также у вампира слева выросли "усы", вместо ткани/тела какие-то щепки. Результат очень спорный.
R-ESRGAN 4x+ Anime6B:
Плюсы: ткань/тело получилась хорошей.
Минусы: цепь размазалась, голова справа стала слишком восковой. Результат очень спорный.
R-ESRGAN 4x+:
Плюсы: цепь получилась неплохой.
Минусы: голова справа получилась хуже всех.
SwinIR 4x:
Снова данная модель выдала самый сбалансированный вариант. Цепь лучше всех, ткань/кожа тоже, блики-свет тоже.

Вердикт:
Выбираю SwinIR 4x именно из-за баланса и отсутствия вольных изменений и интерпретаций.

Сэмпл 3:

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

4x-UltraSharp:
Плюсы: силуэт оторванной руки лучше всех остальных сочетается с фоном и выглядит органично.
Минусы: очень много мелких артефактов фона, растяжки на коричневом фоне справа-снизу, перешарпеное предплечье, кисть самая четкая, но это, внезапно, недостаток, кажется артефактным, мелкие брызги крови поломались и стали не тем, чем планировались в оригинале.
R-ESRGAN 4x+ Anime6B:
Плюсы: перчатка выглядит неплохо, сбалансированно, кровь хоть и мультяшная, но выглядит лучше других, нет артефактов на фоне.
Минусы: лезвия неплохи, четкие, но заартефачили в цвете и потянули ареол из цветовых и графических артефактов (добавили то, чего не планировалось), силуэт оторванной руки выглядит инородным.
R-ESRGAN 4x+:
Плюсы: перчатка смотрится прекрасно.
Минусы: силуэт оторванной руки выглядит очень инородным, лезвия превратились в леденцы (мыльно), на фоне словно "попытка" скрыть артефакты jpg, вместо реального скрытия.
SwinIR 4x:
На этот раз не могу сказать, что данная модель справилась лучше всех. На фоне мелькают артефакты, справа-снизу черная окантовка частично размазалась с белой, силуэт оторванной руки выглядит очень инородным, лезвия получились очень спорными.

Вердикт:
Самое сложное решение, но именно в данном случае мне больше всего нравится R-ESRGAN 4x+ Anime6B.

Сэмпл 4:

Лучшая Ai upscale модель для изображений [Stable Diffusion] Stable Diffusion, Искусственный интеллект, Нейронные сети, Компьютерная графика, Арты нейросетей, Сравнение, Длиннопост

4x-UltraSharp:
Текст артефачит, на фоне справа-сверху самая странная зашарпенная мазня из всех вариантов.
R-ESRGAN 4x+ Anime6B:
Текст - лучший из всех, но немного смущает перемультяшенный участок справа-сверху.
R-ESRGAN 4x+:
Все очень сбалансированно.
SwinIR 4x:
Все очень сбалансированно, но участок справа-сверху лучший именно в этом варианте.

Вердикт:
Однозначно SwinIR 4x. Текст ничем не хуже аниме модели, зато участок на фоне - лучший.

Итог:
R-ESRGAN 4x+: такая же как SwinIR 4x, только чуть хуже то в том, то в этом, а значит смысла в ее использовании нет совершенно.
R-ESRGAN 4x+ Anime6B: как мне кажется для манги, аниме и недетализированных комиксов подойдет идеально, т.е. если в изображении нет мелких деталей и текстур - однозначно лучший вариант.
4x-UltraSharp: самое четкое изображение из всех вариантов, не заваливает все в аниме и воск или в супер реализм, но порой артефачит и с текстом не в ладах, а для комиксов это очень важно. Применять можно если нужна самая четкая картинка, но ты не боишься еще и поработать руками.

ФИНАЛ:

Однозначный победитель - SwinIR 4x. В 99% выдает самый лучший результат. Пусть и не всегда самая четкая картинка, зато по всем аспектам самая сбалансированная, ничего не меняет и не добавляет, хорошо работает с текстом, просто все делает хорошо. Добавляем сюда то, что генерация быстрее всех конкурентов, а вес результата не самый большой - даже и сомневаться не приходится.

1 место: SwinIR 4x
2 место: R-ESRGAN 4x+ Anime6B
3 место: 4x-UltraSharp
4 место: R-ESRGAN 4x+

На этом всё.

Показать полностью 6

Фотореалистичные девушки (Ai SD)

Фотореалистичные девушки (Ai SD) Искусственный интеллект, Арты нейросетей, Нейронные сети, Stable Diffusion, Компьютерная графика, Цветные волосы, Киберпанк, Digital, Цифровой рисунок, 2D, Длиннопост
Фотореалистичные девушки (Ai SD) Искусственный интеллект, Арты нейросетей, Нейронные сети, Stable Diffusion, Компьютерная графика, Цветные волосы, Киберпанк, Digital, Цифровой рисунок, 2D, Длиннопост
Фотореалистичные девушки (Ai SD) Искусственный интеллект, Арты нейросетей, Нейронные сети, Stable Diffusion, Компьютерная графика, Цветные волосы, Киберпанк, Digital, Цифровой рисунок, 2D, Длиннопост
Фотореалистичные девушки (Ai SD) Искусственный интеллект, Арты нейросетей, Нейронные сети, Stable Diffusion, Компьютерная графика, Цветные волосы, Киберпанк, Digital, Цифровой рисунок, 2D, Длиннопост
Фотореалистичные девушки (Ai SD) Искусственный интеллект, Арты нейросетей, Нейронные сети, Stable Diffusion, Компьютерная графика, Цветные волосы, Киберпанк, Digital, Цифровой рисунок, 2D, Длиннопост
Показать полностью 5

Эмулятор CHIP8DALE 4.0 (CHIP8, SCHIP, XOCHIP)

Всем привет, хочу представить обновление моего эмулятора CHIP8.

Наша группа по эмуляторам консолей: https://vk.com/rpcs3

Скачать: https://vk.com/topic-75040291_49930902

Показать полностью

Эмулятор CHIP8DALE 3.0 (CHIP8, SCHIP, XOCHIP)

Всем привет, хочу представить обновление моего эмулятора CHIP8, который стал поддерживать игры XOCHIP и обзавелся новыми настройками и улучшениями графики.

Скачать: https://vk.com/topic-75040291_49930902

Спасибо за внимание!

Показать полностью
Отличная работа, все прочитано!