В этом видео я расскажу как использовать Wildcards или постановочные знаки в Фокусе (Fooocus) для генерации уникальных и разнообразных изображений. Узнаете, как легко создавать множество вариаций из одного запроса, как улучшать качество визуализаций и значительно сокращать время на создание контента.
Вы узнаете:
- Что такое Wildcards и как они работают в Фокусе.
- Пошаговая инструкция по включению и настройке Wildcards для разных типов изображений.
- Примеры применения Wildcards для разнообразия персонажей, фонов и стилей.
- Советы по эффективному использованию этой функции для создания портфолио или коммерческих изображений.
Вы уже наверное слышали про Flux и как ее запустить на Comfy? Наверное только ленивый про нее не записал видео)) В этом видео я расскажу как это сделать на новом Forge Web Ui. Сам фордж на сегодняшний день еще в разработке, и много функций там еще не допилино, но протестировать как работает модель Flux уже можно. Лично я ей очень доволен и искренне советую и вам попробовать.
В Южной Корее разработали новые ИИ-учебники для 5 млн школьников всех классов – от начального до выпускного. Контент этих учебников адаптируется под текущий уровень знаний ученика.
Исследователи Google Deep Mind провели анализ сообщений о случаях мошенничества с использованием ИИ и выяснили, для каких преступлений чаще всего используются возможности GenAI. Спойлеры:
Самый популярный вид кибермошенничества с применением ИИ – имперсонация, когда злоумышленники с помощью дипфейк-технологий притворяются другими людьми.
Один из самых впечатляющих случаев мошенничества произошел в феврале 2024 года в Гонконге, когда злоумышленникам удалось убедительно подделать видеоконференцию с участием нескольких лиц. Все участники, включая фальшивого финансового директора, выглядели настолько естественно, что ничего не подозревающий сотрудник послушно перевел $25,6 млн на подставной счет.
Компания Groq, разработавшая уникальный супербыстрый LPU (языковой процессор), получила $640 млн инвестиций и оценку в $2,8 млрд, что свидетельствует о фундаментальном сдвиге в индустрии ИИ-инфраструктуры – Groq стал серьезным конкурентом для NVIDIA.
На опенсорсной платформе LMSYS Chatbot Arena, где ИИ-компании часто тестируют предстоящие релизы, появился некий anonymous-chatbot, который превосходит GPT-4o и остальные крупнейшие модели и, возможно, является секретным проектом Q*/Strawberry от OpenAI. На это намекнулАльтман.
Новая модель роботов-гуманоидов Figure 02 успешно прошла тестирование на заводе BMW. Робот поддерживает диалог благодаря генеративному ИИ от OpenAI, может поднимать до 25 кг, выполняет задачи автономно и работает 8 часов без подзарядки.
На платформе Mistral теперь можно создать собственных ИИ-агентов, имеющих такую же функциональность, как кастомные GPT.
Феноменальный успех ChatGPT сделал Сэма Альтмана одним из самых влиятельных людей в мире, и это должно внушать серьезное беспокойство всем нам. По наблюдениям Гэри Маркуса, которые он подробно изложил в разоблачительной статье, директору OpenAI и деятельности его компании нельзя доверять:
Во время слушаний по вопросам регулирования ИИ в сенате США Альтман предоставил неполную и неискреннюю информацию и солгал, отвечая на вопрос о том, получает ли он прибыль от OpenAI. Альтман буквально сказал, что получает денег «достаточно для оплаты медстраховки». При этом один автомобиль из его обширного автопарка, Koenigsegg Regera, стоит не менее $4 млн.
Несмотря на публичные заявления Альтмана о необходимости регулирования ИИ, на деле OpenAI активно лоббирует ослабление регулирования.
OpenAI не уделяет достаточного внимания вопросам безопасности ИИ, что подтверждается уходом нескольких ключевых сотрудников, занимавшихся безопасностью.
Деятельность OpenAI подразумевает использование огромных объемов электроэнергии, воды и других ресурсов. Такое же безответственное отношение к ресурсам переняли все конкуренты OpenAI – от Anthropic до Microsoft. Никто не пытается «озеленить» ИИ-индустрию.
Технологии OpenAI активно используются для создания политической дезинформации – компания признала несколько инцидентов, но не предпринимает видимых усилий для предотвращения подобных случаев.
Илон Маск снова решил судиться с OpenAI и ее основателями – Сэмом Альтманом и Грэгом Брокманом. Юридическая команда Маска утверждает, что Альтман и Брокман «усердно манипулировали Маском», убеждая его стать соучредителем их якобы благотворительной организации, обещая безопасность и прозрачность OpenAI, что отличало ее от альтернатив, ориентированных на прибыль. Иск выходит за рамки простых договорных споров, поскольку содержит серьезные юридические обвинения, включая финансовое мошенничество, нарушение договора, сетевое мошенничество и даже нарушение RICO («Закона о коррумпированных и находящихся под влиянием рэкетиров организациях»).
Привет!
Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.
В еженедельных письмах ты найдешь:
Новости о прорывных исследованиях в области машинного обучения и нейросетей.
Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
Статьи об этических аспектах развития технологий.
Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
Обзоры инструментов и библиотек для разработки нейронных сетей.
Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
Фильмы, сериалы и книги, которые заслуживают внимания AI-энтузиастов.
Semantic Scholar – бесплатный ИИ-поисковик по огромной базе (220,2 млн +) научных публикаций из всех отраслей науки. Имеет API для использования в собственных приложениях.
Napkin AI – визуализирует информацию в виде любой бизнес-графики – диаграмм, схем, графиков, презентаций и т. д.
🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»
AIswers – платформа, на которой можно задавать вопросы множеству ИИ-моделей одновременно.
Spreadsite – превращает данные из CSV-файлов в интерактивные дашборды и сайты.
GummySearch – находит Reddit-сообщества, попадающие под описание целевой аудитории продукта.
На Hugging Face выпустили опенсорсную модель CogVideoX-2B для генерации видео, по качеству сопaоставимую с Sora.
MiniCPM-V – опенсорсная минимодель, которая имеет всего 8 млрд параметров и работает на смартфоне, но при этом превосходит GPT-4V в понимании содержимого изображений и видео в реальном времени.
MiniCPM-V отлично понимает смысл и контекст изображений
Flux – модель, разработанная командой, создавшей Stable Diffusion. По многочисленным отзывам, во многом превосходит Midjourney и DALL-E. И самое главное – ее можно установить на свой комп и даже на приличный игровой ноутбук. Протестировать можно на платформе NightCafe.
Примеры генераций Flux
🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»
25 опенсорных инструментов для использования в ИИ-проектах
Vanna – Python-библиотека, которая позволяет автоматически писать SQL-запросы и задавать базе данных вопросы на естественном языке.
Khoj – AI-помощник для поиска информации. Понимает разные форматы файлов, включая Word, PDF, Markdown и другие, а также интегрируется с платформами вроде Notion.
Flowise – визуальный конструктор для построения пользовательских потоков управления языковыми моделями и AI-агентами.
LLAMA GPT – локальный и автономный чат-бот, похожий на ChatGPT.
LocalAI – API-сервер, совместимый с API OpenAI, который позволяет запускать языковые модели, генерировать изображения и аудио локально или на своей инфраструктуре без использования GPU.
Continue – один из лучших AI-ассистентов для написания кода. Он позволяет подключать разные модели и контексты, чтобы создавать пользовательские автодополнения и чат-интерфейсы внутри VS Code и JetBrains IDE.
Chat2DB – ИИ-платформа для управления данными, разработки и анализа. Может конвертировать естественный язык в SQL (и наоборот), а также автоматически генерировать отчеты.
🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале
LibreChat – продвинутая платформа для создания собственного интерфейса для чат-ботов. Она предлагает множество настроек и поддержку разных AI-провайдеров, сервисов и интеграций, предоставляет единый интерфейс для общения с несколькими AI-ассистентами.
Lobe Chat – фреймворк для создания чат-интерфейсов с языковыми моделями. Он поддерживает речевой синтез, мультимодальность и расширяемую систему плагинов.
MindsDB – платформа для настройки AI на основе корпоративных данных. Она позволяет развертывать, обслуживать и настраивать модели в режиме реального времени, используя данные из баз данных, векторных хранилищ или сторонних приложений.
AutoGPT – полуавтономный агент, способный автоматизировать сложные процессы, выполняя последовательности действий без постоянного вмешательства человека.
🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука»
reor – ИИ-приложение для ведения заметок. Автоматически связывает заметки, отвечает на вопросы и обеспечивает семантический поиск. Все данные хранятся локально, а редактирование заметок происходит в Markdown-редакторе, похожем на Obsidian.
Leon – персональный ассистент, который может работать на вашем сервере. Выполняет разные задачи по вашему запросу и может общаться голосом или текстом. Имеет модульную структуру навыков, которую при желании можно расширить.
Instrukt – терминальная среда с интегрированным ИИ. Позволяет создавать и инструктировать модульных AI-агентов, генерировать индексы документов для ответов на вопросы и назначать инструменты для любого агента.
Quivr – RAG-фреймворк для создания специализированных AI-ассистентов с разными возможностями.
Open Interpreter – интерфейс, который позволяет отдавать компьютеру команды на естественном языке в терминале и дает возможность LLM выполнять код (Python, JavaScript, Shell и т. д.).
CopilotKit – фреймворк для создания пользовательских AI-помощников в React-приложениях.
GPT Engineer – инструмент, который позволяет вам описать нужное приложение на естественном языке, а затем наблюдать, как AI пишет, выполняет и вносит улучшения в код.
Dalai – самый простой инструмент для запуска моделей Llama* и Alpaca локально на вашем компьютере.
🤖🎥 Все самое полезное про нейросети для генерации видео и дипфейки вы найдете на нашем телеграм-канале «Библиотека нейровидео»
OpenLLM – инструмент, позволяющий с помощью одной команды запускать любые опенсорсные LLM в виде API-эндпоинтов. Поддерживает множество моделей и оптимизирован для использования в высоконагруженных приложениях.
Unsloth – ускоряет процесс тонкой настройки больших языковых моделей (Llama-3*, Mistral, Phi-3 и Gemma). Позволяет проводить файнтюнинг в два раза быстрее, используя на 70% меньше памяти, без потери точности.
E2B – предоставляет безопасную среду (песочницу) для AI-агентов и приложений. Это особенно полезно при создании ИИ-приложений с возможностями выполнения кода.
Camel AI – фреймворк, предлагающий масштабируемый подход к созданию систем с несколькими AI-агентами, которые могут эффективно взаимодействовать друг с другом.
Aider – ИИ-напарник программиста, который работает в терминале. Он может начинать новые проекты, умеет редактировать файлы и работать с существующими Git-репозиториями. Aider совместим со всеми популярными моделями (GPT-4, Sonnet 3.5, DeepSeek Coder, Llama 70b и другими).
FastEmbed – быстрая и легкая Python-библиотекадля генерацииэмбеддингов (векторных представлений) документов. Она использует ONNX runtime вместо PyTorch, что и делает ее быстрее традиционных решений.
Жаркий летний привет всем вам, друзья и товарищи! Пятница и у меня есть немного моего для Вас. Благодарю всех, кто поддерживал меня добрым комментом и лаком!
В начале лета плотно погрузился в работу, и её оказалось значительно больше, чем я прогнозировал. Но все рабочие задачи достойно реализованы: выпустил спектакль на малой сцене, деятельно поучаствовал в выпуске ещё одного спектакля на большой сцене нашего же театра, приобщился к театральной лаборатории на стороне и съездил на гастроли в стольный град, не ударив в грязь лицом и получил массу впечатлений!
Работать во время отпуска (внезапно, как и догнать Савранского) оказалось утопией, да и отдохнуть и посвятить время семейными делами было значительно важнее! И вот наконец-то я рад представить вам подзадержавшуюся 14ю главу. Финал АмДм уже маячит на горизонте и можно начинать обратный отсчёт ;)
Пара иллюстраций от нас со Stable diffusin в комментарии
ЗЫ: так же на подходе очень значимая для меня (и не только!) работа по Роберту Шекли и другие зреющие планы. Рад буду форсировать их изо всех сил. До скорой встречи и приятного прослушивания!
Это некоммерческий проект и, если вы вдруг захотите поддержать меня кружкой пива или чашкой кофе, моей радости не будет предела в рамках разумного) ваш Lastfrom.
В этом видео продолжим изучение Stable Diffusion и сегодня расскажу про очень интересное расширение, оно мне очень нравиться, которое увеличивает качество как артов так и фото и добавляет на них дополнительные детали исходя из промта и покажу на примерах как им пользоваться.
В этом видео вы узнаете модель Flux от А до Я. Вы узнаете какие версии этой модели есть и сравним их. Узнаете требования к железу для работы с этой моделью. Узнаете как установить эту модель на ComfyUI и получите лучшую схему на данный момент. И самое главное на что эта модель способна. Сравним основные параметры и увидите на примерах на что эти параметры влияют.
В новом выпуске подкаста ведущие Думфэйс и Шахерезада погружаются в бездонный мир новостей из сферы ИИ. От запуска продвинутого голосового интерфейса OpenAI до конкуренции Microsoft на том же поле, от нового AI-хаба Qualcomm до обновлений Google Gemini и отложенных планов Apple по ИИ — ведущие обсуждают всё самое интересное. Они затрагивают этические вопросы использования ИИ, например, в случае с Meta и их чатботом с лицами знаменитостей, а также более приземлённые, вроде внедрения голосового ИИ в Taco Bell. Думфэйс и Шахерезада делятся своими мыслями о Runway Gen3, Leonardo в Canva, Midjourney 6.1, Stable Diffusion и FLU^X от Black Forest Labs, подчеркивая, как эти технологии меняют мир творчества. Не обходят стороной и драматичные события в Bungie, связанные с сокращениями и финансовыми трудностями после покупки студии Sony. Ведущие анализируют ситуацию, поднимают вопросы ответственности руководства и влияния таких решений на игровую индустрию в целом. В завершение выпуска Думфэйс и Шахерезада благодарят слушателей за поддержку и обещают вернуться с новыми инсайтами из мира ИИ. Шахерезада: Мы должны сказать что запрещенные в России соцсети Instagram, FaceBook принадлежат корпорации Meta, корпорация Meta признана в России экстремистской организацией, ее деятельность запрещена.
В мире, где технологии развиваются с невероятной скоростью, я решил провести интересный эксперимент. Моей целью было создать полнофункционального Telegram-бота, не написав при этом ни единой строчки кода самостоятельно. Вместо этого я использовал искусственный интеллект по имени Claude Sonnet, который генерировал весь необходимый код на основе моих текстовых инструкций.
Вот что получилось:
Знакомьтесь: бот-фотограф с искусственным интеллектом
Результатом моего эксперимента стал @korenev_ai_bot - это нейрофотограф и нейростилист в одном лице.
Вот что умеет бот:
Превращает вас в кого угодно: хотите побыть звездой кино или, наоборот, почувствовать себя бродягой? Бот создаст ваше фото в любом образе.
Меняет детали на фото: если вам не нравится ваша футболка, бот может "надеть" на вас пиджак.
Создает фотографии в разных стилях: от классики до авангарда.
Экспериментирует с вашей внешностью: хотите узнать, как бы вы выглядели с другой прической или цветом волос? Легко!
Как это работает?
В основе бота лежат две мощные технологии искусственного интеллекта:
Stable DiffusionXL - это "художник", который создает и редактирует изображения.
GPT4o-mini - "мозг" бота, который понимает ваши запросы и дает инструкции "художнику".
От идеи к реальности: процесс создания
Весь процесс разработки занял около пяти дней и разделился на два этапа:
Этап 1: Быстрый старт (2 вечера)
Сначала я попросил Claude создать код для работы с сервисом, который генерирует изображения. Я просто дал AI документацию и попросил написать код.
Затем мы создали первое меню бота - "Стань героем". Я описал Claude, что хочу видеть, и он предложил готовое решение.
Наконец, мы с клаудом объединили все части вместе, и бот ожил.
Этап 2: Расширение и оптимизация (3 дня)
На втором этапе наш проект начал активно развиваться, что потребовало немного более структурированного подхода:
Рост и структурирование: По мере добавления новых функций бота, мы с Claude научились лучше организовывать код. Мы разбили его на несколько файлов, что сделало проект более понятным и удобным для работы.
Улучшение процесса разработки: Я начал использовать систему контроля версий Git. Это позволило нам легко отслеживать все изменения и эффективнее управлять растущим проектом.
Оптимизация общения с AI: Чем больше становился проект, тем важнее было чётко формулировать задачи для Claude. Я научился периодически "обновлять контекст" нашего общения, что значительно улучшило качество работы.
Этот этап был чуть сложнее первого, но он принёс много новых знаний и навыков. Мы с Claude стали настоящей командой, способной решать всё более сложные задачи.🧍♂🤖💪
Чему научил меня этот эксперимент
AI уже сегодня способен создавать сложные проекты, но ему нужно умелое руководство человека.
Разработка с помощью AI требует нового подхода: важно уметь четко формулировать задачи и управлять большими объемами информации.
Технология еще не идеальна: AI может путаться в сложных проектах и забывать детали, но эти проблемы решаемы.
Что дальше?
Этот эксперимент открыл для меня новые горизонты в мире разработки с помощью искусственного интеллекта. У меня появилось много идей о том, как можно улучшить этот процесс и преодолеть обнаруженные ограничения.
В следующий раз я планирую подойти к разработке с AI более системно, используя полученный опыт. Если вам интересно следить за моими дальнейшими экспериментами в этой области, подписывайтесь на мой Telegram-канал "GPT в тапочках". Там я буду делиться своими новыми идеями и открытиями в мире AI-разработки.