Дайджест новостей про ИИ в России и мире с 19 по 25 апреля
Google выпустил предварительную версию Gemini 2.5 Flash — более быструю и гибкую версию своей облегчённой ИИ модели. Gemini 2.5 Flash создана на основе Flash 2.0, отличается более надёжной логикой и скоростью. Разработчики могут протестировать модель через API Gemini с помощью Google AI Studio и Vertex AI. Модель также доступна пользователям в приложении Gemini.
Adobe выпустила последнюю версию своего семейства моделей ИИ Firefly. Модель для создания изображений Firefly Image Model 4 может генерировать изображения с разрешением до 2K. Более мощная версия этой модели Image Model 4 Ultra может создавать сложные сцены с большим количеством деталей. Видеомодель Firefly, которая была запущена в ограниченной бете, стала доступной для всех. Векторная модель Firefly позволяет создавать редактируемые векторные изображения, а также изменять и генерировать их. Обновленное веб-приложение предоставляет доступ ко всем новым моделям, а также к нескольким моделям создания изображений и видео от OpenAI. Мобильное приложение Firefly пока находится в разработке.
Разработчики SkyworkAI представили SkyReels V2 — открытую модель для генерации видео по текстовому описанию. Архитектура Diffusion Forcing объединяет мультимодальные языковые модели и многоступенчатую предварительную подготовку данных. В итоге нейросеть генерирует более согласованные видео любой продолжительности.
В «Сбере» разработали первую версию модели угроз для систем ИИ. Она охватывает все ключевые этапы функционирования ИИ-систем, от подготовки данных и разработки ИИ-модели до её внедрения в приложение. В документе описаны 70 потенциальных угроз для моделей генеративного (GenAI) и прогностического (PredAI) ИИ.
Чат-бот Grok от xAI теперь может отвечать на вопросы о том, что видно на камере вашего смартфона, аналогично функциям распознавания в реальном времени в Gemini и ChatGPT. Другие новые возможности, которые запустили в Grok: многоязычное аудио и поиск в режиме реального времени в голосовом режиме Grok. Пользователи Grok на Android могут использовать их, только если они подписаны на тарифный план SuperGrok от xAI стоимостью $30 в месяц.
В мессенджере Max от VK теперь доступен GigaChat 2.0. Он генерирует текст и изображения, транскрибирует аудио, саммаризирует тексты и видео, GigaChat 2.0 доступен в двух версиях мессенджера, базовой и расширенной.
Character.AI представили закрытую бету AvatarFX — анимированных видеоботов. Модель анимирует персонажей платформы в различных стилях и голосах, от персонажей, похожих на людей, до 2D-мультфильмов о животных.
В Nari Labs выпустили компактную нейросеть Dia для генерации диалогов из текста. Пользователи могут управлять эмоциями собеседников и невербальной коммуникацией — смехом, кашлем и вздохами.
Microsoft расширяет возможности Microsoft 365 Copilot в обновлении «Copilot Wave 2», добавляя новые агенты, инструменты для создания изображений и корпоративный поиск на основе ИИ.
Напоследок о неожиданном применении ИИ. В ОАЭ решили доверить написание новых законов и изменение старых искусственному интеллекту. Власти страны рассчитывают, что использование ИИ позволит сократить время разработки законов на 70%. Планируется создать базу данных со всеми федеральными и местными законами, судебными прецедентами и другими сведениями из различных ведомств. ИИ проанализирует весь этот массив и сформирует предложения по изменению в законодательство. Что ж, не только в ОАЭ не помешало бы заменить чиновников искусственным интеллектом…