Российские нейросети: 10 помощников на все случаи жизни
В мире искусственного интеллекта Россия не отстает. Отечественные разработчики создают мощные нейросети, способные решать самые разные задачи – от написания текстов и создания изображений до генерации музыки и раскраски черно-белых фотографий.
Вот 10 лучших российских нейросетей, которые стоит попробовать:
1. Craik X (https://t.me/CraikXBot): Бесплатный бот в Telegram с собственной языковой моделью Craik 1 Pro. Быстро генерирует ответы, анализирует фотографии и вскоре обещает создавать видео и фото.
2. GigaChat (https://developers.sber.ru/gigachat): Разработка Сбербанка, способная общаться, генерировать тексты, изображения и код. Доступна на русском и английском языках.
3. YandexGPT (https://ya.ru/ai/gpt-3): Нейросеть Яндекса, генерирующая тексты на различные темы. Встроена в голосовой помощник Алиса.
4. «Шедеврум» (https://shedevrum.ai): Приложение Яндекса, работающее на базе YandexGPT. Генерирует текст, изображения и видео по запросам пользователей.
5. Kandinsky (https://t.me/kandinsky21_bot): Нейросеть Сбера для генерации изображений, анимации и видео. Создает изображения по текстовому описанию, стилизует картинки и даже генерирует видео.
6. «Балабоба» (https://yandex.ru/lab/balaboba): Сервис Яндекса, сочиняющий тексты за считанные секунды. Закончит начатую историю, придумает подпись для фото или напишет синопсис фильма.
7. «Маэстро» (https://apps.sber.ru/salute-apps/a6ac79e1-b490-41fc-8695-d143cb12dddf/): Сервис Сбера, генерирующий музыку по названию группы и трека.
8. «Порфирьевич» (https://porfirevich.ru): Сервис, дописывающий истории. Вы начинаете, он продолжает. Подходит для поиска идей и борьбы с писательским блоком.
9. Colorize (https://colorize.cc): Нейросеть, раскрашивающая черно-белые фото и видео. Разработана россиянином Александром Кожевиным.
10. ruGPT-3 XL (https://russiannlp.github.io/rugpt-demo/): Русская модель с 1,3 млрд параметров, способная продолжать тексты на русском и английском языках, а также генерировать код.
Эти нейросети — лишь верхушка айсберга. Российские разработчики активно работают над созданием новых инструментов ИИ, которые упростят жизнь и помогут решать всевозможные задачи. Следите за обновлениями и не бойтесь пробовать новое!
Omost - новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры
Всем привет!
Omost, разработанный lllyasviel - это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе
Название Omost (произношение: "almost") символизирует:
Каждый раз, когда вы используете Omost, ваше изображение почти готово
"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения
Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией
Интерфейс очень простой и понятный, похож на Fooocus. Большая часть параметров перекочевала из Automatic1111, если вы уже с ним знакомы, то переходите к следующему разделу. Ниже остановимся подробнее
1 — Окно "Prompt"
Основное рабочее пространство
В это окно прописываем текстовый запрос с учётом позиционирования объектов на изображении (например, солнце в правом верхнем углу, силуэт по центру и т.п.)
Далее запрос отправляется в LLM-модель, для получения более сложного промпта
2 — New Chat
Работает подобно созданию нового чата в ChatGPT.
Необходим в случаях, когда нужно уйти от контекста предыдущей генерации.
3 — Edit Last Input - редактирование последнего текстового запроса
4 — Random Seed
Случайный параметр начального шума, из которого будет происходит генерация конечного изображения. Вводится вручную.
Не используйте слишком длинные комбинации цифр, достаточно 4-7 случайных цифр
5 — Окно Language Model
Настройки языковой модели:
Temperature - пришло от ChatGPT, чем больше «temperature», тем более художественный ответ даст ИИ.
Max New Tokens - максимальное количество вводимых токенов
6 — Окно Image Diffusion Model
Image Width - ширина изображения
Image Height - высота изображения
Используйте числа, кратные 64, начиная от 512 (например, 1024x1024, 768x1024 и т.д.)
Image Number - количество итоговых изображений.
Sampling Steps - количество шагов по созданию изображения. Чем их больше, тем дольше нейросеть будет над ней работать.
7 — Вкладка "Advanced"
CFG Scale - величина соответствия текстовому запросу. Для большинства XL-моделей используется от 1 до 5-6.
Настройки для Hi-Res Fix:
HR-Fix Scale - величина апскейла (повышения разрешения), увеличивает время генерации и нагрузку на видеопамять. Рекомендую оставить единицу.
Highres Fix Steps - шаги апскейла
Highres Fix Denoise - мера "новизны" изображения. Чем выше это значение, тем сильнее итоговая картинка будет отличаться от исходной. От 0 до 1.
Negative prompt - негативный запрос, в нём описываем то, чего не должно быть на изображении.
В Omost используется модель RealVisXL 4.0
Процесс генерации
Давайте поближе взглянем на сам процесс преобразования промпта
Пишем вот такой запрос на входе:
a British Shorthair cat on the center
А вот то, что мы получаем на выходе:
А вот изображение на выходе:
Или давайте совсем просто:
a woman
Как видно на скриншотах, можно в мельчайших подробностях задавать параметры позиционирования: от лица, цвета волос и причёски до губ, глаз и одежды. Выглядит всё это очень интересно!
Хочу сгенерировать силуэт девушки на фоне ночного неба. Введём следующий запрос в нижнее окно:
Dark silhouette of a girl in the bottom right, she looks at the starry night sky, standing on a grass field, a forest in the left, fireflies, dark composition
Параметры не меняю
После обработки запроса нажимаем Render the Image!
Получаем следующие результаты:
Omost, к сожалению, не всегда строго придерживается позиционирования
Далее я пишу в чат "поменяй девочку на кошку", жму Render the image и получаю следующее:
Теперь хочу изобразить рыжую девушку в левой части изображения. Сгенерируем следующий запрос:
beautiful woman with short redhair on the left, pale skin, freckles, big green eyes, slim face, green sweatpants, belly button, white socks, lying in her bed,
Ещё один пример
rusalka on the left, aesthetic of street art with knowledge-sharing atmosphere, fog, high depth of field, f/4, framing, groundbreaking breathtaking magnum with precise details, award winning, (Travel Photography by Ashley Gilbertson and George Platt Lynes:0.1), (pastel and bluish-purple colors:0.1),
Придерживайтесь правила: один чат - один сюжет на изображении
Для создания новой композиции нажимаем справа сверху New Chat
На Гите представлены подсказки для позиционирования объектов:
В Omost используется словесное описание позиционирования, а не координатное, потому что "прямое использование координат пикселей или процентных индексов оказалось менее эффективным для LLM"
Так же, если вам нужен точный цвет на изображении, то можно указать его в запросе. На Гите есть слова-триггеры и их HTML-коды. Однако, всё же пока не получается добиться точной цветопередачи
Как итог, Omost - новый экспериментальный инструмент наподобие DALL-E 3, который сочетает в себе мощь LLM- и SDXL моделей
Хочу напомнить, чтобы завести Omost локально, необходима видеокарта как минимум с 8 Гб видеопамяти. Так же он очень требователен к оперативной памяти, съел все мои 16, а я уверен, может и больше
Вы можете попробовать Omost в Demo на Hugging Face
Или скачать портативную версию с установкой в один клик, которая весит всего 1.6 Гб
Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте 7z-архив, который нужно просто разархивировать в любое удобное место
Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!
OpenAI не перестают хвастаться голосовым режимом GPT-4o
Только оцените его эпичную подачу, да этот ИИ способен отправить всех коучей на пенсию
Источник телеграм-канал NEUROHUB🔥👈 Ещё больше нейроконтента
Создание изображений - Pikaso
![](https://cs13.pikabu.ru/post_img/2024/06/12/9/1718205564118044944.jpg)
![](https://cs15.pikabu.ru/post_img/2024/06/12/9/1718205564150699432.jpg)
Создание изображений - Pikaso
Привет! 👋
Хочу поделиться классным сервисом, который я нашёл.
Больше интересного по Искусственному Интеллекту вы можете найти на моем Telegram-канале. Источник: КиберПоток
Бесплатные возможности:
- 20 генераций нового изображения
- 5 изменений стиля
- 2 изменения разрешения
Языки:
- Русский и английский
Возможности:
- ⚡️ Изменение стиля изображения
- ⚡️ Изменение разрешения
- ⚡️ Генерация изображений
- ⚡️ Превращение скетча в изображение
Важно:
При изменении стиля лица могут не всегда выходить идеально. В платной версии можно менять промт, в бесплатной версии он формируется автоматически. Чтобы не тратить попытки, лучше сначала использовать превью.
Мой совет:
Внимательно читайте инструкции и смотрите примеры успешных генераций. Это поможет избежать ошибок и сэкономить ресурсы.
Если что, спрашивайте в комментариях! 💬
Всех обнял, приподнял и поставил на место! ❤️
Больше интересного по Искусственному Интеллекту вы можете найти на моем Telegram-канале. Источник: КиберПоток
Как загружать файлы в ИИ и получать результаты ?
![](https://cs13.pikabu.ru/post_img/2024/06/12/9/1718203128145611872.jpg)
![](https://cs15.pikabu.ru/post_img/2024/06/12/9/1718203128111756410.jpg)
![](https://cs13.pikabu.ru/post_img/2024/06/12/9/1718203128180520806.jpg)
Как загружать файлы в ИИ и получать результаты ?
Привет, друзья! 👋 👑 ⭐️
Хотите знать, как загружать файлы в ИИ и мгновенно получать ответы? Вот как это сделать:
1. Загрузите файл: Нажмите на иконку "Загрузить файл" и выберите нужный файл на компьютере.
2. Введите запрос: После загрузки напишите, что хотите узнать. Например: "Опиши, что на фото".
3. Получите ответ: ИИ обработает ваш запрос и выдаст результат.
Пример: Я загрузил логотип и вот что получил:
"На изображении логотип с надписью 'КИБЕР ПОТОК'. В центре – киберпанк-птица с элементами робота. Вокруг – символы (молния, огонь). Фон – светло-голубой, текст – крупный, в технологичном стиле."
Попробуйте сами и убедитесь, как это просто и удобно!
Всех люблю и всех обнял 🥰
Больше интересного по Искусственному Интеллекту вы можете найти на моем Telegram-канале. Источник: КиберПоток
Поиграем в бизнесменов?
Одна вакансия, два кандидата. Сможете выбрать лучшего? И так пять раз.