FABULAai

FABULAai

https://clck.ru/3CKKRS
На Пикабу
Дата рождения: 10 ноября
341 рейтинг 22 подписчика 3 подписки 63 поста 1 в горячем
2

Тизер от Black Forest Labs. Новый игрок в гонке видео генераций

Всего неделю назад компания Black Forest Labs выпустила свою новую разработку — FLUX.1, которая уже успела произвести фурор в сфере искусственного интеллекта. Однако разработчики не собираются останавливаться на достигнутом и уже представили тизер своей новой технологии — генерации видео на уровне SOTA (state-of-the-art).

На официальном сайте компании появился тизер, который демонстрирует впечатляющие возможности нового инструмента. Видео на сайте искажено эффектом телевизионных помех, что придаёт ему особую атмосферу и оставляет ощущение, что мы стоим на пороге настоящего технологического прорыва. Пока неизвестно, когда именно состоится полноценный релиз, но, судя по скорости развития, ждать осталось недолго.

Black Forest Labs — компания, занимающаяся разработкой инновационных решений в сфере искусственного интеллекта. Они известны своими передовыми технологиями, которые часто задают новые стандарты в индустрии. Их недавний релиз, FLUX.1, уже получил широкое признание за свои уникальные возможности.

Термин SOTA (state-of-the-art) используется для описания передовых технологий и методик, которые являются наилучшими на данный момент в своей области. В контексте искусственного интеллекта это означает применение самых современных алгоритмов и архитектур, способных достигать максимальных показателей производительности.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
1

ИИ-трек «Verknallt in einen Talahon» покоряет топ-чарты Германии

На этой неделе немецкий музыкальный чарт Top 100: Germany в Apple Music удивил новым и неожиданным хитом — трек «Verknallt in einen Talahon», созданный с помощью искусственного интеллекта, стремительно поднялся на 74-е место. Эта сатирическая песня высмеивает субкультуру «талахонов» — подростков-гангстеров, набирающую популярность в Германии, особенно в TikTok.

В тексте песни описывается романтическая увлечённость главным героем, стереотипным представителем данной субкультуры. Он одет в роскошные бренды, такие как Louis Vuitton и Gucci, носит кроссовки Air Max и занимается тёмными делами, балансируя на грани закона. Вместе с тем, персонаж не забывает о своей "гангстерской" харизме, которая очаровывает главную героиню.

Песня стала вирусной не только благодаря своей сатирической направленности, но и за счёт того, как точно она передаёт дух и стиль жизни молодых людей, активно следящих за тенденциями в социальных сетях. Острый юмор и удачное музыкальное сопровождение сделали её фаворитом среди слушателей, вызвав бурные обсуждения в интернете и медиа.

ИИ-трек «Verknallt in einen Talahon» покоряет топ-чарты Германии

Хотя субкультура «талахонов» вызывает немало споров и критики в обществе, популярность песни свидетельствует о том, что эта тема находит отклик у молодой аудитории, и искусственный интеллект всё чаще становится инструментом для создания успешных музыкальных проектов.

Показать полностью 1
0

Lumina-mGPT: новый tex2image генератор из Китая

Группа ученых, включая Донгяна Лю, Шитиана Чжао и других, представила Lumina-mGPT — нейросеть для создания фотореалистичных изображений из текстовых описаний. Эта модель отличается тем, что использует специальный трансформер, который может «понимать» и соединять текст и изображения.

Lumina-mGPT обучается на больших объемах текста и картинок, что позволяет ей создавать довольно реалистичные изображения. Модель сначала учится на большом количестве данных, а затем дорабатывается на качественных примерах текстов и изображений, что помогает достигать еще лучшего результата.

Кроме того, Lumina-mGPT может выполнять множество различных задач: от создания изображений по тексту до анализа и понимания визуальной информации.

Генерация от Lumina-mGPT

Генерация от Lumina-mGPT

Тот же промпт в SD

Тот же промпт в SD

Стоит отметить, что хотя Lumina-mGPT и выглядит многообещающе, она не является абсолютной инновацией, первые попытки генераций показали небольшие галлюцинации. Хотя, многое зависит от языка, модель китайская, потому и промпт на лучше понимает именно на китайском.

В целом, результат все-равно достойный, даже не смотря на то, что генерация одного изображения занимает, порой, до получаса.

Показать полностью 2
0

Упрощенная версия модели Llama 3.1

Совсем недавно вышла nano-llama31 — упрощённая версия мощной модели Llama 3.1. Этот проект разработан для того, чтобы сделать работу с нейросетью проще и доступнее.

Что такое nano-llama31? Это минималистичная реализация Llama 3.1, которая требует всего 6 файлов для работы. В отличие от более сложных и объемных официальных реализаций, nano-llama31 позволяет легко обучать и настраивать модель, не тратя время на сложные зависимости и громоздкий код.

Зачем это нужно? Проект ориентирован на разработчиков и исследователей, которые хотят использовать передовую модель для обработки текста, не углубляясь в технические сложности. Это идеальный вариант для создания чат-ботов, анализа текстов и других задач, где важна простота и скорость внедрения.

Планы на будущее Проект всё ещё находится на ранней стадии, но Karpathy уже планирует:

Упростить код и сделать его более удобным для работы;
Добавить функции для удобного дообучения и использования моделей;
Расширить поддержку более крупных моделей и исправить текущие технические недочеты.
Напомним, Llama 3.1 — это продвинутая нейросеть для обработки текста с открытым исходным кодом. Она обладает огромным числом параметров (более 405 миллиардов) и использует мощное оборудование для обучения, что позволяет достигать высоких результатов в различных задачах обработки текста. Модель разработана для улучшения качества генерации текста, создания умных чат-ботов и выполнения других сложных текстовых задач. Llama 3.1 предоставляет гибкость для исследователей и разработчиков, позволяя им модифицировать и адаптировать модель под свои нужды.

______________________________________

Показать полностью
1

InternVideo2: ИИ нейросеть для описания и распознавания видео от OpenGVLab

Команда OpenGVLab выпустила в открытый доступ две новые модели, которые могут помогать в работе с видео:

Эти модели могут отвечать на вопросы о содержимом видео и давать текстовые описания того, что происходит на экране. Они базируются на мощной нейросети под названием Mistral-7B и специально разработаны для понимания контекста видео.

Как они обучались:

  1. Модели учились восстанавливать удалённые кусочки видео.

  2. Затем они учились связывать визуальные образы с другими типами данных, такими как звук и текст.

  3. В конце они обучались предсказывать следующие шаги, основываясь на том, что видят в видео.

Эти шаги делают модели способными давать точные ответы на вопросы о видео и описывать сложные сцены.

Различие между двумя моделями в том, что версия с пометкой "HD" обучалась на видео высокого разрешения, что делает её более подходящей для работы с видео в высоком качестве.

Подробную информацию о том, как использовать эти модели, можно найти на сайте Hugging Face. Пока что удобного пользовательского интерфейса для них нет.

📌 Лицензия: MIT License (это значит, что использовать модели можно свободно).

______________________________________

ДЕТАЛИ:

Что нового?

Теперь InternVideo2 интегрирована в систему VideoLLM, которая включает в себя большую языковую модель (LLM) и видео BLIP. Это сделано для улучшения взаимодействия модели с текстом и видео. В процессе обучения модель обновляется, что помогает ей лучше понимать и описывать видео.

Как начать работу?

  1. Получите доступ: Прежде чем использовать модель, нужно получить доступ к базовой модели Mistral-7B. Если доступа нет, его можно запросить на сайте Hugging Face и добавить свой токен в переменные окружения.

  2. Настройте окружение: Убедитесь, что у вас установлена версия transformers 4.38.0 или выше. Установите необходимые пакеты Python, используя файл pip_requirements.

  3. Используйте модель: Вот как можно использовать модели для анализа видео:

    • Загрузите видео.

    • Обработайте его и получите текстовые описания.

    • Задавайте вопросы и получайте ответы о содержимом видео.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
0

Gen-3 Alpha Image to Video: обновление, которое требует доработки

Компания Runway представила обновление для своего инструмента Gen-3 Alpha Image to Video, которое теперь позволяет пользователям задавать изображение в качестве первого или последнего кадра видео. Эта функция может использоваться отдельно или в сочетании с текстовой подсказкой, предоставляя больше возможностей для создания уникального видеоконтента.

Это обновление, конечно, дает несколько очков Gen-3, однако не позволит вырваться в лидеры гонки, напомним, что платформа Luma уже предоставляет возможность задавать как первый, так и последний кадры видео, что даёт пользователям больше контроля над процессом создания роликов.

И хотя Gen-3 Alpha пока предлагает выбор только одного кадра — первого ИЛИ последнего. Эта функция все равно важна для рекламщиков и маркетологов, которым необходимо создавать видеоролики с яркими и запоминающимися финальными кадрами. Завершение видео заранее выбранным изображением помогает усилить впечатление и обеспечить сильное визуальное воздействие на зрителя, что критически важно в условиях высокой конкуренции на рынке рекламы и маркетинга.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью 2
1

Новинка от HuggingFace, отличный способ предсказать креативность языковых моделей

HuggingFace представил новый интересный проект — интерактивную демонстрацию, которая показывает, как разные настройки влияют на то, какой текст будет генерировать модель. Даже если вы только начинаете разбираться в теме, этот инструмент поможет понять, как настраивать генерацию текста.

О чем речь?

Когда модели, такие как те, что используются в OpenAI, создают текст, они используют определенные параметры, чтобы решить, какой именно будет следующий символ или слово. Эти параметры называются Temperature, Top-k и Top-p. Вот что они делают:

  • Temperature: Этот параметр управляет тем, насколько "смелой" будет модель в своих предсказаниях. Если значение низкое, модель будет стараться выбрать самый вероятный вариант — то есть, она будет аккуратной и предсказуемой. Если значение высокое, она может начать придумывать более креативные, но иногда странные варианты.

  • Top-k: Здесь модель рассматривает только ограниченное количество вариантов для следующего слова. Например, если Top-k=5, модель выберет из пяти самых вероятных слов, а остальные просто игнорирует. Это помогает сделать текст более контролируемым.

  • Top-p: Похож на Top-k, но работает немного иначе. Модель выбирает слова, пока их суммарная вероятность не достигнет определенного порога. Это тоже помогает управлять разнообразием текста.

Таким образом, пользователи HuggingFace используя такие параметры как Temperature, Top-k и Top-p смогут увидеть, как изменение параметров инференса влияет на разнообразие и креативность сгенерированного текста.


______________________________________
Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
3

FLUX.1: новая text2image нейросеть от новой команды Black Forest Labs

Команда бывших разработчиков Stable Diffusion, покинувшая Stability AI, создала новую компанию — Black Forest Labs. Всего за несколько месяцев они разработали модель FLUX.1 с 12 миллиардами параметров, которая стала лучшей в мире среди открытых моделей для генерации изображений.

FLUX.1 построена на той же архитектуре, что и известная SD3, и уже превосходит конкурентов, включая MJ6. Модель доступна в трех версиях:

FLUX.1 [pro]: топовая версия с выдающейся детализацией и точностью. Доступна через API:

FLUX.1 [dev]: быстрая версия с почти таким же качеством, но доступная бесплатно по некоммерческой лицензии:

FLUX.1 [schnell]: сверхбыстрая версия, работающая за считанные секунды, но с немного сниженным качеством. Доступна бесплатно:

В планах у Black Forest Labs — выпуск передовой модели для генерации видео. Следите за новостями!

__________________________________________________________________________________________ Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества