Исследователи Google представили модель GameNGen, способную симулировать прохождение DOOM в реальном времени.
Испанские исследователи создали модель AINU, способную определять онкологические и вирусные заболевания на самых ранних стадиях, до появления каких-либо видимых или ощущаемых симптомов. Этот ИИ замечает клеточные поражения на наноуровне, даже если их размер не превышает всего 20 нм (что в 5 000 раз меньше диаметра человеческого волоса).
Plaud представила новый носимый ИИ-гаджет, NotePin, стоимостью $169. Он предназначен для создания заметок и суммаризации всего, что происходит в жизни владельца.
В Gemini появились Gems – аналог кастомных GPT и Copilot Studio. Можно воспользоваться одним из преднастроенных Gem (среди них есть ассистент по программированию, редактор текста, карьерный консультант и т. п.) или создать нужного помощника с нуля.
Илон Маск недавно объявил, что Tesla теперь – в первую очередь компания по производству роботов, и электромобили она будет собирать только ради финансирования этой великой цели. Однако свежая модель Optimus совсем не впечатлила посетителей конференции в Пекине: роботы китайских производителей, например Unitree, выглядят очень продвинуто на фоне Tesla-бота.
Бывший исследователь OpenAI сообщил, что компания близка к созданию супер-ИИ, но его безопасностью буквально некому заниматься: за 2024 год из 30 специалистов по безопасности ИИ осталось всего 16.
Грядущий GPU от NVIDIA, Blackwell, демонстрирует 4-кратное увеличение скорости работы по сравнению со своим популярным предшественником, H100. Эта разработка подтверждает лидирующую позицию компании в нише, но потенциальные конкуренты тоже готовы сделать весомый вклад в развитие AI-инфраструктуры: стартапы Tenstorrent, Cerebras Systems, D-Matrix, Groq и SiMa.ai недавно представили чипы, которые во многом превосходят возможности существующих GPU от NVIDIA.
Wormhole (Tenstorrent) и WSE-3 (Cerebras Systems) – самый большой ИИ-чип в мире
Привет!
Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.
В еженедельных письмах ты найдешь:
Новости о прорывных исследованиях в области машинного обучения и нейросетей.
Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
Статьи об этических аспектах развития технологий.
Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
Обзоры инструментов и библиотек для разработки нейронных сетей.
Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
Фильмы, сериалы и книги, которые заслуживают внимания AI-энтузиастов.
🛠️ Инструменты
GPT Engineer – разрабатывает веб-приложения любой сложности.
Photoroom – продвинутый ИИ-редактор со множеством функций для модификации и улучшения качества изображений.
Documind – чат с PDF-документами.
Viggle – оживляет изображения, воспроизводя нужные движения из видеореференса.
Reddit Scout – ищет нужные обсуждения на Reddit и делает суммаризацию.
JobTailor – поможет найти работу вашей мечты.
MakeMyAnime – генерирует анимешные видео в любом стиле.
AI Ease – бесплатно создает профессиональные фотопортреты по селфи.
AI Ease генерирует фото для профайлов и резюме
VoiceGen – гиперреалистичная озвучка и клонирование голоса.
Magicam – заменяет лицо на видео в реальном времени.
PackPack – браузерное расширение для сохранения, организации и суммаризации любого контента.
🤖 История случайного создания генеративного ИИ
Большинство ИИ-энтузиастов знает, что архитектура трансформера, которая стала основой нынешней технологии генеративных ИИ-моделей, была впервые представлена исследователями Google в 2017 году в публикации «Внимание – это все, что вам нужно». Однако мало кто знает, что генеративные способности трансформера возникли буквально сами собой. Это стало полной неожиданностью для разработчиков модели – изначально они ее создавали для продвинутого машинного перевода, а не для генерации текста.
«Я был шокирован, ошеломлен. Я думал, что мы придем к чему-то подобному через двадцать, двадцать пять лет, а оно просто появилось», – сказал Эйдан Гомес, один из разработчиков первого GPT, о своем революционном детище. Даже сейчас, спустя годы после создания, исследователи команды признают, что многие аспекты работы трансформеров остаются непонятными для них. Как именно было совершено одно из самых важных технологических открытий XXI века, разработчики рассказали журналисту The New Yorker.
Команда из восьми человек работала без устали в течение 12 недель, иногда даже ночуя в офисе. Их задачей было разработать более эффективную систему перевода, способную обрабатывать язык без строгой последовательности, которая замедляла все существующие системы.
Ключевой инновацией стало использование механизма самовнимания в качестве основного компонента модели. Этот подход позволял системе оценивать все слова в тексте одновременно, определяя их взаимосвязи и важность. Самовнимание было известно давно, но до тех пор исследователи всегда использовали его совместно с другими компонентами. Кроме того, самовнимание реализуется с помощью матричного умножения, и на современных GPU эту операцию можно выполнять очень эффектно.
Прорыв произошел, когда они обнаружили, что их модель достигла впечатляющего показателя по BLEU (метрика оценки качества машинного перевода) – более 26 баллов для перевода с английского на немецкий, превзойдя предыдущие системы за считанные часы обучения вместо дней.
Однако настоящий сюрприз ждал их впереди – оказалось, что трансформер способен не только переводить, но и генерировать текст. Исследователи обучили модель на статьях из Википедии (это заняло два дня, в течение которых было обработано чуть менее половины контента энциклопедии) и дали ей задание – написать несколько статей о несуществующем объекте под названием The Transformer. К их изумлению, система сгенерировала пять совершенно правдоподобных статей о вымышленных объектах, включая детальные описания несуществующей японской панк-группы и австралийского ситкома.
Эта неожиданная способность к генерации текста поразила создателей трансформера. Полного понимания того, как это стало возможным, у них нет и сейчас, хотя принцип работы модели в общих чертах стал очевиден сразу же:
Механизм самовнимания позволяет системе находить релевантные связи между словами в большом объеме текста.
Система учится на основе паттернов в данных, не ограничиваясь предписанными правилами грамматики или синтаксиса.
Трансформер обучается продолжать текст, устанавливая отношения между токенами (группами букв, знаков препинания и пробелов).
Увеличение размера модели и объема данных для обучения приводит к значительному улучшению производительности.
🎥 Лучшие AI-инструменты для редактирования видео
Adobe Premiere Pro, известный видеоредактор, теперь предлагает множество инструментов на основе искусственного интеллекта. Некоторые из самых интересных функций включают:
Редактирование клипов с помощью текстовых промптов.
Автоматическую категоризацию аудио – распознает тип звука (музыка, звуковые эффекты, диалоги и т. д.) и предлагает соответствующие инструменты.
Преобразование речи в текст – автоматически создает транскрипты и субтитры на 18 языках.
Подходит для: проектов и специалистов среднего/профессионального уровня.
DaVinci Resolve также предлагает множество инструментов на основе ИИ. Одна из самых интересных функций – распознавание лиц. Она позволяет автоматически группировать клипы по лицам. Это особенно полезно при работе с видеозаписями мероприятий с большим количеством людей.
Подходит для: пользователей и проектов любого уровня.
CapCut – популярное приложение для редактирования видео, известное простотой в использовании. Оно предлагает множество инструментов на основе ИИ, включая автоматическое создание коротких клипов из длинных видео.
Подходит для: создания коротких видео формата TikTok, Instagram* Reels или YouTube Shorts.
Runway специализируется на ИИ-инструментах для генерации и редактирования видеоконтента. Предлагает очень широкую функциональность, но редактирование может быть сложным для начинающих пользователей (а вот генерацией пользоваться очень просто).
Подходит для: опытных специалистов.
InVideo – очень простой и в то же время достаточно мощный инструмент для генерации и редактирования коротких видео.
Подходит для: новичков без опыта редактирования.
ClipChamp – приложение для редактирования и озвучивания видео от Microsoft. Отличается огромным выбором и гибкостью настройки голосов.
Подходит для: начинающих, желающих создавать короткие видео.
Descript – предлагает разные инструменты для обработки видео, включая автоматическое создание транскриптов.
Подходит для: пользователей без опыта, которым нужно редактировать короткие видео и генерировать транскрипты.
Wondershare Filmora – кроссплатформенный видеоредактор, известный простотой и многофункциональностью. Предлагает множество инструментов на основе ИИ, включая интерполяцию кадров и удаление вокала.
Подходит для: пользователей и проектов начального/среднего уровня.
✊ Сделай сам
Генераторы изображений зачастую работают слишком медленно, а все существующие методы ускорения этих моделей требуют большого количества тренировочных изображений. Разработчики SwiftBrush представили новый метод обучения, который не требует реальных изображений. Этот метод вдохновлен технологией создания 3D-моделей по текстовым описаниям и позволяет быстро обучить модель для создания качественных изображений с одного раза.
Video Foundation Model Evaluation Framework – мощный инструмент для работы с видеоданными. Он позволяет анализировать видео, сравнивать их и извлекать из них полезную информацию. Основная функциональность:
Оценивает качество эмбеддингов на разных наборах данных (Kinetics-400, Something-Something-v2, Moments-in-Time, Diving 48).
Находит похожие видео на основе векторных представлений.
Определяет начало и конец действий в видео.
Разбивает видео на сегменты, соответствующие разным действиям.
Визуализирует векторные представления.
LayerPano3D – генератор иммерсивных 3D-сцен, которым можно найти применение в AR/VR, геймдеве и интерактивном обучающем контенте.
* Instagram принадлежит компании Meta, деятельность которой признана экстремистской и запрещена на территории РФ.
Автор рассылки: Наталья Кайда