Продолжение поста «Вот что действительно хотят мужики)»9
Вот он на Али https://aliexpress.ru/item/1005010195688709.html
Реклама: АЛИБАБА КОМ (РУ) ИНН 7703380158
Если вы пробовали генерировать картинки с русскими надписями — знаете эту боль
Запрашиваете у нейросети открытку ко дню рождения с подписью «С днём рождения, Маша», а получаете «C дhём pождehя, Mаwа». Буквы кривые, слова — нечитаемая каша. Хотели открытку — получили современное искусство.
Это не случайность. Большинство моделей для генерации изображений обучаются на открытых датасетах, в которых русский язык представлен слабо. Английские надписи получаются плюс-минус сносно, а с русскими модель буквально не знает, как они должны выглядеть.
Мы взялись за эту задачу в Алисе AI и хотим рассказать, что получилось.






Что сделали
Собрали новый датасет — картинки с русскоязычными надписями и детальной разметкой текста. Параллельно переписали архитектуру модели Alice AI ART, которая отвечает за генерацию изображений.
В итоге картинки с корректным русским текстом — без кривых букв и нечитаемых символов — стали получаться в 3 раза чаще, чем раньше. Заодно подтянулось и общее качество: доля картинок без визуальных искажений выросла на треть.
Как пользоваться, чтобы получилось хорошо
Тут несколько простых приёмов, которые сильно повышают шансы на нормальный результат:
Текст в кавычки. Если хотите конкретную надпись на картинке — напишите её в кавычках в запросе. Модель так понимает, что это именно текст, а не описание.
Сложные слова — заглавными. Если слово длинное или редкое, заглавные буквы помогают модели не запутаться.
Длинные надписи — на короткие фразы. Чем короче кусок текста, тем больше шансов, что он отрисуется без ошибок. Если нужна большая надпись, разбейте её на несколько частей.
С этими тремя приёмами уже можно делать постеры, афиши и открытки, которые не стыдно показать.
Заодно подтянули русский культурный код
Это, кажется, отдельная боль всех нейросетей: попросишь «русский народный ансамбль» — а на картинке люди, отдалённо напоминающие участников фолк-фестиваля где-нибудь в Скандинавии.
Мы дообучили модель на русскоязычных промптах и добавили систему, которая превращает общие запросы в более конкретные визуальные образы. Теперь по запросу «русский народный ансамбль» получаются гармонисты и балалаечники. «Традиционный русский праздничный стол» — это икра, соленья и самовар. А на иллюстрациях про космос появляются российские космонавты, а не безликие астронавты в скафандрах непонятной страны.
Где это работает
Новая модель уже работает в чате с Алисой AI — попробовать можно прямо сейчас.
Реклама ООО «Яндекс», ИНН: 7736207543 erid:3apb1QrvkfDXctBjSXMMdCHhrNy7KqAGzLrvTiV31SHdc
Для энергичных пушистиков
Семья
Уехала жена в командировку.
Через 2 дня муж ей пишет смс-ку: «Где все ложки, ножи и вилки?»
Жена в ответ: «СПИ ДОМА!»
Он ничего не понимает, но ждет ещё 2 дня
и опять пишет смс-ку: «Где все ложки, ножи и вилки? "
Жена в ответ: «СПИ ДОМА!»
Через неделю возвращается жена домой,
муж её встречает злой с вопросом: «Куда ты дела все ложки, ножи и вилки?».
Жена берёт его за руку, ведёт в спальню и стягивает с кровати покрывало, а там лежат ложки, ножи и вилки!
Она: «Я же говорила тебе - «СПИ ДОМА!»
Продолжение поста «Остановите уже кто-нибудь этих китайцев)»2
Вот он на Али https://aliexpress.ru/item/1005006486925957.html
Реклама: АЛИБАБА КОМ (РУ) ИНН 7703380158
Продолжение поста «Остановите уже кто-нибудь этих китайцев)»2
Вот он на Али https://aliexpress.ru/item/1005010581943985.html
Реклама: АЛИБАБА КОМ (РУ) ИНН 7703380158
