FABULAai

FABULAai

https://clck.ru/3CKKRS
На Пикабу
Дата рождения: 10 ноября
342 рейтинг 22 подписчика 3 подписки 63 поста 1 в горячем
2

Тизер от Black Forest Labs. Новый игрок в гонке видео генераций

Всего неделю назад компания Black Forest Labs выпустила свою новую разработку — FLUX.1, которая уже успела произвести фурор в сфере искусственного интеллекта. Однако разработчики не собираются останавливаться на достигнутом и уже представили тизер своей новой технологии — генерации видео на уровне SOTA (state-of-the-art).

На официальном сайте компании появился тизер, который демонстрирует впечатляющие возможности нового инструмента. Видео на сайте искажено эффектом телевизионных помех, что придаёт ему особую атмосферу и оставляет ощущение, что мы стоим на пороге настоящего технологического прорыва. Пока неизвестно, когда именно состоится полноценный релиз, но, судя по скорости развития, ждать осталось недолго.

Black Forest Labs — компания, занимающаяся разработкой инновационных решений в сфере искусственного интеллекта. Они известны своими передовыми технологиями, которые часто задают новые стандарты в индустрии. Их недавний релиз, FLUX.1, уже получил широкое признание за свои уникальные возможности.

Термин SOTA (state-of-the-art) используется для описания передовых технологий и методик, которые являются наилучшими на данный момент в своей области. В контексте искусственного интеллекта это означает применение самых современных алгоритмов и архитектур, способных достигать максимальных показателей производительности.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
1

ИИ-трек «Verknallt in einen Talahon» покоряет топ-чарты Германии

На этой неделе немецкий музыкальный чарт Top 100: Germany в Apple Music удивил новым и неожиданным хитом — трек «Verknallt in einen Talahon», созданный с помощью искусственного интеллекта, стремительно поднялся на 74-е место. Эта сатирическая песня высмеивает субкультуру «талахонов» — подростков-гангстеров, набирающую популярность в Германии, особенно в TikTok.

В тексте песни описывается романтическая увлечённость главным героем, стереотипным представителем данной субкультуры. Он одет в роскошные бренды, такие как Louis Vuitton и Gucci, носит кроссовки Air Max и занимается тёмными делами, балансируя на грани закона. Вместе с тем, персонаж не забывает о своей "гангстерской" харизме, которая очаровывает главную героиню.

Песня стала вирусной не только благодаря своей сатирической направленности, но и за счёт того, как точно она передаёт дух и стиль жизни молодых людей, активно следящих за тенденциями в социальных сетях. Острый юмор и удачное музыкальное сопровождение сделали её фаворитом среди слушателей, вызвав бурные обсуждения в интернете и медиа.

ИИ-трек «Verknallt in einen Talahon» покоряет топ-чарты Германии Искусственный интеллект, Нейронные сети, Германия, Видео, YouTube

Хотя субкультура «талахонов» вызывает немало споров и критики в обществе, популярность песни свидетельствует о том, что эта тема находит отклик у молодой аудитории, и искусственный интеллект всё чаще становится инструментом для создания успешных музыкальных проектов.

Показать полностью 1
0

Lumina-mGPT: новый tex2image генератор из Китая

Группа ученых, включая Донгяна Лю, Шитиана Чжао и других, представила Lumina-mGPT — нейросеть для создания фотореалистичных изображений из текстовых описаний. Эта модель отличается тем, что использует специальный трансформер, который может «понимать» и соединять текст и изображения.

Lumina-mGPT обучается на больших объемах текста и картинок, что позволяет ей создавать довольно реалистичные изображения. Модель сначала учится на большом количестве данных, а затем дорабатывается на качественных примерах текстов и изображений, что помогает достигать еще лучшего результата.

Кроме того, Lumina-mGPT может выполнять множество различных задач: от создания изображений по тексту до анализа и понимания визуальной информации.

Lumina-mGPT: новый tex2image генератор из Китая Искусственный интеллект, Нейронные сети, Длиннопост

Генерация от Lumina-mGPT

Lumina-mGPT: новый tex2image генератор из Китая Искусственный интеллект, Нейронные сети, Длиннопост

Тот же промпт в SD

Стоит отметить, что хотя Lumina-mGPT и выглядит многообещающе, она не является абсолютной инновацией, первые попытки генераций показали небольшие галлюцинации. Хотя, многое зависит от языка, модель китайская, потому и промпт на лучше понимает именно на китайском.

В целом, результат все-равно достойный, даже не смотря на то, что генерация одного изображения занимает, порой, до получаса.

Показать полностью 2
0

Упрощенная версия модели Llama 3.1

Совсем недавно вышла nano-llama31 — упрощённая версия мощной модели Llama 3.1. Этот проект разработан для того, чтобы сделать работу с нейросетью проще и доступнее.

Что такое nano-llama31? Это минималистичная реализация Llama 3.1, которая требует всего 6 файлов для работы. В отличие от более сложных и объемных официальных реализаций, nano-llama31 позволяет легко обучать и настраивать модель, не тратя время на сложные зависимости и громоздкий код.

Зачем это нужно? Проект ориентирован на разработчиков и исследователей, которые хотят использовать передовую модель для обработки текста, не углубляясь в технические сложности. Это идеальный вариант для создания чат-ботов, анализа текстов и других задач, где важна простота и скорость внедрения.

Планы на будущее Проект всё ещё находится на ранней стадии, но Karpathy уже планирует:

Упростить код и сделать его более удобным для работы;
Добавить функции для удобного дообучения и использования моделей;
Расширить поддержку более крупных моделей и исправить текущие технические недочеты.
Напомним, Llama 3.1 — это продвинутая нейросеть для обработки текста с открытым исходным кодом. Она обладает огромным числом параметров (более 405 миллиардов) и использует мощное оборудование для обучения, что позволяет достигать высоких результатов в различных задачах обработки текста. Модель разработана для улучшения качества генерации текста, создания умных чат-ботов и выполнения других сложных текстовых задач. Llama 3.1 предоставляет гибкость для исследователей и разработчиков, позволяя им модифицировать и адаптировать модель под свои нужды.

______________________________________

1

InternVideo2: ИИ нейросеть для описания и распознавания видео от OpenGVLab

Команда OpenGVLab выпустила в открытый доступ две новые модели, которые могут помогать в работе с видео:

Эти модели могут отвечать на вопросы о содержимом видео и давать текстовые описания того, что происходит на экране. Они базируются на мощной нейросети под названием Mistral-7B и специально разработаны для понимания контекста видео.

Как они обучались:

  1. Модели учились восстанавливать удалённые кусочки видео.

  2. Затем они учились связывать визуальные образы с другими типами данных, такими как звук и текст.

  3. В конце они обучались предсказывать следующие шаги, основываясь на том, что видят в видео.

Эти шаги делают модели способными давать точные ответы на вопросы о видео и описывать сложные сцены.

Различие между двумя моделями в том, что версия с пометкой "HD" обучалась на видео высокого разрешения, что делает её более подходящей для работы с видео в высоком качестве.

Подробную информацию о том, как использовать эти модели, можно найти на сайте Hugging Face. Пока что удобного пользовательского интерфейса для них нет.

📌 Лицензия: MIT License (это значит, что использовать модели можно свободно).

______________________________________

ДЕТАЛИ:

Что нового?

Теперь InternVideo2 интегрирована в систему VideoLLM, которая включает в себя большую языковую модель (LLM) и видео BLIP. Это сделано для улучшения взаимодействия модели с текстом и видео. В процессе обучения модель обновляется, что помогает ей лучше понимать и описывать видео.

Как начать работу?

  1. Получите доступ: Прежде чем использовать модель, нужно получить доступ к базовой модели Mistral-7B. Если доступа нет, его можно запросить на сайте Hugging Face и добавить свой токен в переменные окружения.

  2. Настройте окружение: Убедитесь, что у вас установлена версия transformers 4.38.0 или выше. Установите необходимые пакеты Python, используя файл pip_requirements.

  3. Используйте модель: Вот как можно использовать модели для анализа видео:

    • Загрузите видео.

    • Обработайте его и получите текстовые описания.

    • Задавайте вопросы и получайте ответы о содержимом видео.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
0

Gen-3 Alpha Image to Video: обновление, которое требует доработки

Компания Runway представила обновление для своего инструмента Gen-3 Alpha Image to Video, которое теперь позволяет пользователям задавать изображение в качестве первого или последнего кадра видео. Эта функция может использоваться отдельно или в сочетании с текстовой подсказкой, предоставляя больше возможностей для создания уникального видеоконтента.

Это обновление, конечно, дает несколько очков Gen-3, однако не позволит вырваться в лидеры гонки, напомним, что платформа Luma уже предоставляет возможность задавать как первый, так и последний кадры видео, что даёт пользователям больше контроля над процессом создания роликов.

И хотя Gen-3 Alpha пока предлагает выбор только одного кадра — первого ИЛИ последнего. Эта функция все равно важна для рекламщиков и маркетологов, которым необходимо создавать видеоролики с яркими и запоминающимися финальными кадрами. Завершение видео заранее выбранным изображением помогает усилить впечатление и обеспечить сильное визуальное воздействие на зрителя, что критически важно в условиях высокой конкуренции на рынке рекламы и маркетинга.

______________________________________

Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью 2
1

Новинка от HuggingFace, отличный способ предсказать креативность языковых моделей

HuggingFace представил новый интересный проект — интерактивную демонстрацию, которая показывает, как разные настройки влияют на то, какой текст будет генерировать модель. Даже если вы только начинаете разбираться в теме, этот инструмент поможет понять, как настраивать генерацию текста.

О чем речь?

Когда модели, такие как те, что используются в OpenAI, создают текст, они используют определенные параметры, чтобы решить, какой именно будет следующий символ или слово. Эти параметры называются Temperature, Top-k и Top-p. Вот что они делают:

  • Temperature: Этот параметр управляет тем, насколько "смелой" будет модель в своих предсказаниях. Если значение низкое, модель будет стараться выбрать самый вероятный вариант — то есть, она будет аккуратной и предсказуемой. Если значение высокое, она может начать придумывать более креативные, но иногда странные варианты.

  • Top-k: Здесь модель рассматривает только ограниченное количество вариантов для следующего слова. Например, если Top-k=5, модель выберет из пяти самых вероятных слов, а остальные просто игнорирует. Это помогает сделать текст более контролируемым.

  • Top-p: Похож на Top-k, но работает немного иначе. Модель выбирает слова, пока их суммарная вероятность не достигнет определенного порога. Это тоже помогает управлять разнообразием текста.

Таким образом, пользователи HuggingFace используя такие параметры как Temperature, Top-k и Top-p смогут увидеть, как изменение параметров инференса влияет на разнообразие и креативность сгенерированного текста.


______________________________________
Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Показать полностью
3

FLUX.1: новая text2image нейросеть от новой команды Black Forest Labs

Команда бывших разработчиков Stable Diffusion, покинувшая Stability AI, создала новую компанию — Black Forest Labs. Всего за несколько месяцев они разработали модель FLUX.1 с 12 миллиардами параметров, которая стала лучшей в мире среди открытых моделей для генерации изображений.

FLUX.1 построена на той же архитектуре, что и известная SD3, и уже превосходит конкурентов, включая MJ6. Модель доступна в трех версиях:

FLUX.1 [pro]: топовая версия с выдающейся детализацией и точностью. Доступна через API:

FLUX.1 [dev]: быстрая версия с почти таким же качеством, но доступная бесплатно по некоммерческой лицензии:

FLUX.1 [schnell]: сверхбыстрая версия, работающая за считанные секунды, но с немного сниженным качеством. Доступна бесплатно:

В планах у Black Forest Labs — выпуск передовой модели для генерации видео. Следите за новостями!

__________________________________________________________________________________________ Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Отличная работа, все прочитано!