Нейромания
1 пост
1 пост
3 поста
4 поста
4 поста
Тут должно быть видео, но его не будет, так как обосраный вк при экспорте видоса выдает собаку усераку вместо видео
Привет, моя модель голоса Тилля Линдеманна для so-vits-svc поет песни на русском языке
Золотые купола (Михаил Круг)
Горький вкус (Султан Лагучев)
Щемит в душе тоска (Многоточие)
Фантазер (Ярослав Евдокимов)
Еще больше у меня в группе: https://vk.com/neuromaniacss
Привет, моя модель голоса Тилля Линдеманна для so-vits-svc поет песни Агаты Кристи
Черная луна
Я сделал модель голоса Тилля Линдеманна для so-vits-svc, как вам?
Еще больше нейрокаверов у меня в группе: https://vk.com/neuromaniacss
Всем привет, решил провести небольшой эксперимент и выяснить, какая модель апскейлинга лучше всего подходит для реставрации артов/комиксов и т.д. Текста будет много, как и примеров, так что кто пришел за быстрым ответом - сорян.
Также, представленные далее изображения не подходят для детей!
Мой PC:
ОС: Microsoft Windows 10 Pro x64
CPU: OctalCore Intel Core i7-11700KF, 4700 MHz (47 x 100)
Motherboard: Gigabyte Z590 Aorus Pro AX
RAM: 16256 МБ (DDR4 SDRAM)
GPU: NVIDIA GeForce RTX 3060 (12 ГБ)
Stable Diffusion (Automatic1111):
version: v1.3.2
python: 3.10.6
torch: 2.0.1+cu118
xformers: 0.0.17
gradio: 3.32.0
Исходное изображение (взято из свободных источников для ознакомления и цитирования):
Технические данные:
Разрешение: 1600x1270 (немного отличается от того, что прикрепил, т.к. обрезал рекламу)
Расширение: jpg
Апскейлинг до 6400x5080 (x4)
Модели апскейлинга:
ScuNET GAN
ScuNET PSNR
SwinIR 4x
4x-UltraSharp
R-ESRGAN 4x+ Anime6B
R-ESRGAN 4x+
Lanczos
Nearest
После прогона через все модели получил такие данные:
Выкладывать готовые полноформатные изображения не буду, чтобы не захламлять пост, вместо этого, в каждом результате я вырезал по 4 одинаковых кусочка 1024x1024, чтобы поближе их рассмотреть и сравнить. Буду выставлять по каждой категории сэмплов галочку той модели, которая на мой взгляд справилась лучше всех.
Оговорюсь, что я буду описывать только 4x UltraSharp, R-ESRGAN 4x+ Anime6B, R-ESRGAN 4x+, SwinIR 4x, так как остальные модели выдают плюс-минус одинаково паршивый результат и ковырять их смысла не вижу, если надо - можете сами посмотреть и оценить.
Поехали:
В оригинале баки, шерсть и зубы плохо читаются, все изображение пикселизовано, присутствуют артефакты jpg. Далее оригинал не буду описывать, можете посмотреть исходное изображение и понять насколько там все плохо.
Также, стоит делать скидку на то, что пикабу, скорее всего, пожмет качество и то, что видите вы, не совсем то, что вижу я.
Поэтому, можете скачать исходники сэмплов тут: https://disk.yandex.ru/d/55idZOxfaHEAMA
4x-UltraSharp:
Плюсы: все читается, четкие контурные линии, нет артефактов, зубы хорошо различимы, баки и волосы на плече хороши. Самое важное - стиль сохранен.
Минусы: баки частично срезаны слева, на правой части зубов вылез артефакт в виде линии.
R-ESRGAN 4x+ Anime6B:
Плюсы: в целом выглядит очень вкусно, контурные линии - лучшие среди всех результатов, нет артефакта на зубах. Кожаный костюм выглядит лучше, чем в других результатах.
Минусы: баки превратились в пенку, волосы на плече стали рваной кожей, стиль не сохранен, все стало слишком прилизанным, восковым, потерялись мелкие детали. Стиль уходит в аниме.
R-ESRGAN 4x+:
Плюсы: самый сбалансированный результат, нет артефактов, хорошие линии, баки не мыльные, но слишком реалистичные, выбиваются из общего стиля.
Минусы: кожаный костюм местами стал словно шерстяным, не критично, но немного некорректно, все элементы читаются хуже, чем у моделей выше. Стиль уходит в реализм.
SwinIR 4x:
Лучший и самый сбалансированный вариант, баки, волосы, костюм, все выглядит максимально хорошо и сбалансированно.
Вердикт:
Выбираю SwinIR 4x именно из-за баланса и отсутствия вольных изменений и интерпретаций.
4x-UltraSharp:
Плюсы: голова справа получилась лучше всех.
Минусы: цепь на шее вампира слева превратилась в греческий узор, также у вампира слева выросли "усы", вместо ткани/тела какие-то щепки. Результат очень спорный.
R-ESRGAN 4x+ Anime6B:
Плюсы: ткань/тело получилась хорошей.
Минусы: цепь размазалась, голова справа стала слишком восковой. Результат очень спорный.
R-ESRGAN 4x+:
Плюсы: цепь получилась неплохой.
Минусы: голова справа получилась хуже всех.
SwinIR 4x:
Снова данная модель выдала самый сбалансированный вариант. Цепь лучше всех, ткань/кожа тоже, блики-свет тоже.
Вердикт:
Выбираю SwinIR 4x именно из-за баланса и отсутствия вольных изменений и интерпретаций.
4x-UltraSharp:
Плюсы: силуэт оторванной руки лучше всех остальных сочетается с фоном и выглядит органично.
Минусы: очень много мелких артефактов фона, растяжки на коричневом фоне справа-снизу, перешарпеное предплечье, кисть самая четкая, но это, внезапно, недостаток, кажется артефактным, мелкие брызги крови поломались и стали не тем, чем планировались в оригинале.
R-ESRGAN 4x+ Anime6B:
Плюсы: перчатка выглядит неплохо, сбалансированно, кровь хоть и мультяшная, но выглядит лучше других, нет артефактов на фоне.
Минусы: лезвия неплохи, четкие, но заартефачили в цвете и потянули ареол из цветовых и графических артефактов (добавили то, чего не планировалось), силуэт оторванной руки выглядит инородным.
R-ESRGAN 4x+:
Плюсы: перчатка смотрится прекрасно.
Минусы: силуэт оторванной руки выглядит очень инородным, лезвия превратились в леденцы (мыльно), на фоне словно "попытка" скрыть артефакты jpg, вместо реального скрытия.
SwinIR 4x:
На этот раз не могу сказать, что данная модель справилась лучше всех. На фоне мелькают артефакты, справа-снизу черная окантовка частично размазалась с белой, силуэт оторванной руки выглядит очень инородным, лезвия получились очень спорными.
Вердикт:
Самое сложное решение, но именно в данном случае мне больше всего нравится R-ESRGAN 4x+ Anime6B.
4x-UltraSharp:
Текст артефачит, на фоне справа-сверху самая странная зашарпенная мазня из всех вариантов.
R-ESRGAN 4x+ Anime6B:
Текст - лучший из всех, но немного смущает перемультяшенный участок справа-сверху.
R-ESRGAN 4x+:
Все очень сбалансированно.
SwinIR 4x:
Все очень сбалансированно, но участок справа-сверху лучший именно в этом варианте.
Вердикт:
Однозначно SwinIR 4x. Текст ничем не хуже аниме модели, зато участок на фоне - лучший.
Итог:
R-ESRGAN 4x+: такая же как SwinIR 4x, только чуть хуже то в том, то в этом, а значит смысла в ее использовании нет совершенно.
R-ESRGAN 4x+ Anime6B: как мне кажется для манги, аниме и недетализированных комиксов подойдет идеально, т.е. если в изображении нет мелких деталей и текстур - однозначно лучший вариант.
4x-UltraSharp: самое четкое изображение из всех вариантов, не заваливает все в аниме и воск или в супер реализм, но порой артефачит и с текстом не в ладах, а для комиксов это очень важно. Применять можно если нужна самая четкая картинка, но ты не боишься еще и поработать руками.
Однозначный победитель - SwinIR 4x. В 99% выдает самый лучший результат. Пусть и не всегда самая четкая картинка, зато по всем аспектам самая сбалансированная, ничего не меняет и не добавляет, хорошо работает с текстом, просто все делает хорошо. Добавляем сюда то, что генерация быстрее всех конкурентов, а вес результата не самый большой - даже и сомневаться не приходится.
На этом всё.
Всем привет, хочу представить обновление моего эмулятора CHIP8.
Наша группа по эмуляторам консолей: https://vk.com/rpcs3
Всем привет, хочу представить обновление моего эмулятора CHIP8, который стал поддерживать игры XOCHIP и обзавелся новыми настройками и улучшениями графики.
Спасибо за внимание!