Автор статьи: Ворогушин Алексей Геннадьевич.
Автор статьи: Ворогушин Алексей Геннадьевич
СОЗДАНИЕ ИНСТРУМЕНТА НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ОБЪЕКТИВНОЙ ОЦЕНКИ НЕЙРОАРТОВ.
В эпоху бурного развития нейросетей и генеративного искусства многие художники и энтузиасты сталкиваются с новой проблемой: как выбрать лучшие изображения из сотен сгенерированных вариантов? Эта задача становится особенно актуальной при подготовке материалов для публикации в социальных сетях, где необходимо отобрать всего несколько работ из множества достойных.
Проблема выбора среди множества
При генерации изображений с помощью нейросетей часто получается огромное количество вариантов. Например, из 400 сгенерированных изображений нужно выбрать 10–20 лучших. Однако для публикации в социальных сетях требуется всего 1–3 работы. Встает сложный вопрос: какие изображения выбрать, а какими пожертвовать? Субъективный выбор может быть затруднен из-за привязанности автора к своим работам или из-за сложности объективно оценить каждое изображение.
Идея создания AI-инструмента для оценки изображений
Стремясь решить эту проблему, возникла идея создать дополнительный инструмент на основе искусственного интеллекта, который бы более объективно оценивал нейроарты и помогал в процессе отбора. Цель заключалась в том, чтобы разработать бота, способного анализировать изображения по ряду критериев и предоставлять обоснованную оценку каждой работы.
Разработка бота для оценки нейроартов
На платформе для создания чат-ботов был разработан бот, который оценивает нейроарты по десяти критериям, используя 100-балльную систему, и в конце выводит средний балл. Даже если оценка не является полностью объективной, она помогает выявить лучшие изображения и принять информированное решение о выборе работ для публикации.
Десять критериев оценки:
🔴Техническое мастерство: уровень детализации, качество текстур, использование светотени, цветовая палитра и общая точность исполнения.
🔴Креативность и новизна: уникальность и инновационность идеи работы.
🔴Оригинальность образов: степень уникальности выбранных визуальных образов и элементов.
🔴Эмоциональное воздействие: эмоции, которые вызывает работа у зрителя.
🔴Глубина смысла и идеи: насколько глубоко и ясно работа передает идею или концепцию.
🔴Композиция и целостность: гармоничность и сбалансированность композиции.
🔴Универсальность: возможность адаптации работы для использования в различных контекстах.
🔴Актуальность: соответствие текущим тенденциям в искусстве и культуре.
🔴Культурное влияние: потенциал работы влиять на других художников или стать частью культурного наследия.
🔴Потенциал известности: вероятность того, что работа станет известной на глобальном уровне.
Настройка бота на критическую оценку
При разработке бота особое внимание уделялось тому, чтобы он был максимально критичен в своих оценках. Многие существующие генеративные модели, поддерживающие загрузку и анализ изображений, склонны завышать оценки. Даже самые передовые модели не могли объективно оценить изображения: личные некачественные фотографии получали вероятность всемирной известности в 60–70%.
Выбор модели Gemini.ai 1.5 Fresh от Google
После тестирования различных моделей была обнаружена модель Gemini.ai 1.5 Fresh от Google, которая смогла более объективно оценивать изображения. Несмотря на то, что она не является самой передовой, она справилась с задачей лучше остальных. Эта модель дала некачественным личным фотографиям вероятность всемирной известности в 1–5%, что значительно ближе к реальности. При этом "Мона Лиза" получила оценку в 99%, оставив 1% на возможность будущего забвения.
Реализация алгоритма в боте
Алгоритм оценки был загружен в информационную базу бота. Теперь процесс оценки стал максимально простым: достаточно загрузить изображение и нажать кнопку публикации сообщения. Бот автоматически проводит анализ по десяти критериям, предоставляет подробный и критический отчет по каждому из них, вычисляет средний балл и указывает вероятность всемирной известности в процентах.
Алгоритм работы бота:
Максимальная критичность: бот настроен на строгую и беспристрастную оценку, избегая субъективных предпочтений.
Подробный анализ: для каждого критерия предоставляется оценка от 0 до 100 баллов с подробным объяснением.
Объективность: особое внимание уделяется выявлению недостатков и областей для улучшения.
Средняя оценка: после оценки всех критериев вычисляется среднее арифметическое.
Вероятность известности: бот указывает вероятность всемирной известности работы в процентах, обосновывая свой вывод.
Надежды на будущее развития моделей
С развитием технологий ожидается появление новых текстовых и аналитических моделей, которые смогут еще более объективно оценивать изображения. Улучшение алгоритмов искусственного интеллекта будет способствовать более точному и справедливому анализу нейроартов, что, в свою очередь, поможет художникам в их творческом процессе.
Заключение
Создание бота для объективной оценки нейроартов решает важную задачу отбора лучших работ из большого количества сгенерированных изображений. Такой инструмент не только облегчает процесс принятия решений, но и способствует развитию критического мышления у художников, позволяя им видеть свои работы со стороны и понимать, в каких областях можно улучшиться.
Внедрение искусственного интеллекта в процесс оценки искусства открывает новые возможности для взаимодействия технологий и творчества. Это шаг вперед в объединении человеческого таланта и машинного анализа, который может привести к новым открытиям и достижениями в мире искусства.
Как пример оценка обложки:
Проведём оценку представленного изображения по десяти критериям, используя 100-балльную шкалу и предоставляя подробный критический анализ. В конце будет представлена сводная таблица оценок.
1) Техническое мастерство (качество исполнения): 95/100
Изображение демонстрирует высочайший уровень технического мастерства. Детализация татуировок, текстура цветов, реалистичная игра света и тени – всё выполнено на превосходном уровне. Цветовая палитра гармонична и эффектна, создавая атмосферу таинственности и красоты. Незначительные погрешности в некоторых цветовых переходах практически незаметны и не влияют на общее впечатление.
2) Креативность и новизна: 85/100
Идея сочетания женского тела, украшенного татуировками в стиле биомеханика и флористики, достаточно оригинальна. Однако, подобные концепции уже встречались в искусстве, поэтому абсолютной новизны здесь нет. Композиция, хотя и эффектна, не предлагает радикально новых подходов.
3) Оригинальность образов и элементов: 80/100
Образы достаточно оригинальны в своём сочетании, но отдельные элементы (стиль татуировок, цветочные мотивы) заимствованы из уже существующих художественных традиций. Некоторые цветочные композиции кажутся несколько клишированными.
4) Эмоциональное воздействие: 90/100
Изображение вызывает сильные эмоции: восхищение, удивление, возможно, даже некоторую тревогу. Контраст между хрупкостью модели и агрессивностью татуировок создаёт напряженное, но захватывающее впечатление. Эмоциональное воздействие глубокое и многогранное.
5) Глубина смысла и идеи: 75/100
Смысл изображения не очевиден и требует интерпретации. Можно предположить, что работа исследует темы красоты, природы и искусственности, взаимосвязь человека и природы. Однако, глубина концепции могла бы быть раскрыта более явно.
6) Композиция и целостность: 92/100
Композиция хорошо сбалансирована, все элементы гармонично взаимодействуют друг с другом. Модель расположена в центре, цветы обрамляют её, создавая динамичный и цельный образ. Небольшие недостатки в композиции практически не заметны.
7) Универсальность и применимость: 70/100
Изображение может быть использовано в качестве обложки книги, плаката или в рекламных целях. Однако, его специфический стиль ограничивает его универсальность. Не все контексты подойдут для такого яркого и несколько провокационного изображения.
8) Актуальность и соответствие трендам: 88/100
Работа соответствует современным тенденциям в цифровом искусстве, используя популярные стили и техники. Она привлекательна для современной аудитории, ценящей оригинальность и визуальную насыщенность.
9) Культурное влияние и значимость: 60/100
Потенциал культурного влияния имеется, но трудно предсказать его масштабы. Работа может вдохновить других художников, но вряд ли станет культовым произведением.
10) Потенциал всемирной известности: 70%
Вероятность всемирной известности оценивается в 70%. Изображение достаточно эффектное и оригинальное, чтобы привлечь внимание широкой аудитории. Однако, его специфический стиль и неявный смысл могут ограничить его популярность.
Общая средняя оценка: 82.5/100
Ссылка на анализ данного изображения :
https://poe.com/s/10P63BPaWzcMPBLmzBL6
ССЫЛКА НА БОТА
https://poe.com/Vorogushin_Aleksey_G
Доказательство прав на изображение по ссылке :
https://cloud.mail.ru/public/YMVG/3erhFfvzX
Я оставляю ссылки на скриншоты как доказательства прав на изображения.
Скриншоты показывают логотип и интерфейс ideogram.ai, что подтверждает публичную оферту, согласно которой все права на сгенерированные изображения передаются пользователю.
На скриншотах видна выписка из документации о предоставлении прав
На скриншотах видны ФИО владельца аккаунта и его дата рождения, что позволяет идентифицировать его.
Скриншоты демонстрируют закрепление пинов, что указывает на доступ к ним. Это подтверждает, что аккаунт принадлежит мне, так как только владелец может закреплять свои изображения.