Ждете обновление Алисы?
Продается умная колонка на Али и на Яндекс Маркете.
Продается умная колонка на Али и на Яндекс Маркете.
Google показала, каким будет ИИ-ассистент будущего - Project Astra, и он способен на то, о чём старые голосовые помощники (привет, Siri и Alexa) и мечтать не могли. Astra – это часть проекта Gemini Live, которая наделяет ИИ зрением, слухом и навыками реального действия. Проще говоря, ассистент не только отвечает на вопросы, но и сам выполняет задачи на устройстве, как полноценный секретарь.
Для перевода видео я использовала Elevenlabs - он автоматически переводит видео, сохраняя голос.
На Google I/O 2025 показали впечатляющее демо с ремонтом велосипеда, где пользователь просто разговаривает с ассистентом, а телефон делает всё за него:
Сначала Astra по голосовой команде нашёл в интернете PDF-инструкцию к нужной модели велосипеда, открыл файл и пролистал его до нужного раздела. На экране было видно, как ИИ сам “скроллит” документ пальцем!
Потом по просьбе ассистент открыл YouTube, нашёл подходящее видео по ремонту и включил ролик. То есть вам даже искать ничего не надо — ИИ сам выберет лучший туториал.
Столкнувшись с вопросом о детали, Astra полез в Gmail пользователя. Он нашёл информацию в переписке (например, артикул запчасти или адрес магазина из письма) и выдал ответ, опираясь на личные данные, которые помнил.
Дальше – магия камерой. Пользователь навёл смартфон на кучу различных запчастей перед ним, и ассистент через камеру понял, какая деталь нужна, и подсветил на экране именно её! По сути, зрение ИИ определило объект в реальном мире и указало на него – словно в научной фантастике.
Самостоятельные звонки – помните технологию Duplex? Теперь это встроено в ассистента. В демо Astra позвонил в магазин автозапчастей, разговаривал женским голосом с продавцом почти как живой человек, уточняя наличие нужной детали. Продавец ответил, что деталь есть – и тогда ИИ спросил у пользователя: покупать ли? После утвердительного ответа ассистент оформил заказ. Все детали разговора, интонации – как у настоящего секретаря, люди на том конце провода даже не подозревают, что общаются с ИИ!
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
во время ответа ассистента рядом заговорил другой человек – Astra мгновенно приостановил речь, не путая фоновые реплики с командой. Пользователь сказал “продолжай” – и ИИ продолжил ровно с того места, на котором остановился, без повторов. У ассистента, выходит, есть слух и воспитание 🙂.
Долгая память: когда позже пользователь спросил, какая нужна корзина на велосипед, “чтобы туда влезла моя собака”, Astra вспомнил кличку собаки из прежних диалогов! Он ответил что-то вроде “Да, для Бобби подойдёт такая-то корзина” – то есть ИИ учел личный контекст и продемонстрировал память, как настоящий приятель, который вас давно знает.
Все эти способности Google называет единым термином Action Intelligence (интеллект действий). Проще говоря, Astra сочетает нейросеть Gemini с камерой, микрофоном, экраном и всеми приложениями телефона, чтобы самому выполнять пользовательские задачи. Это синтез нескольких технологий: поиск информации, понимание экрана и окружения, управление приложениями, звонки и общение, контекст из личных данных, длительная память и супер-натуральный голос 🔥
Пока Project Astra – экспериментальный проект. Google уже около года тестирует его в небольшом кругу (в виде отдельного приложения на Android). Но цель ясна: обкатать функции и внедрить всё это великолепие в основное приложение Gemini Live, сделав его универсальным ИИ-помощником.
В общем скоро Google-ассистент у каждого сможет не просто ответить на вопрос, а реально сделать за вас кучу дел – от разбора завалов в почте до управления умным домом.
Про остальные Главные Новинки от Google расскажу и покажу наглядно в следующем посте, кто не хочет ждать, в моем телеграм канале уже пост есть.
Отдельно:
А если вам не хочется заморачиваться, в боте Syntx -- это мини приложение в телеграм, есть все популярные модели в единой подписке, и их можно оплатить русской картой. - Процесс я показала на примере создания Нейрофотосессии со своим лицом
Друзья, вчера прошла конференция Google I/O 2025 - первый день, и там показали СТОЛЬКО всего интересного, что я решила сделать для вас серию постов с самыми важными анонсами.
На видео прокачанный Google Meet - синхронный перевод речи в режиме реального времени с сохранением голоса. Вот здесь можно посмотреть презентации Google - будет пополняться.
Google вывела свою флагманскую ИИ-модель на новый уровень. Gemini 2.5 теперь представлен в двух версиях: Flash (бесплатная) и Pro (продвинутая).
Gemini 2.5 Pro — теперь официально лучшая модель для кодирования в мире. Она лидирует в рейтингах WebDev Arena и LMArena, а ещё получила экспериментальный режим Deep Think — в этом режиме Gemini думает глубже и дольше, чтобы разобраться с очень сложными математическими и кодинговыми задачами. А ещё у неё контекстное окно в 1 миллион токенов.
Gemini 2.5 Flash стала намного эффективнее — использует на 20-30% меньше токенов, при этом улучшена по всем параметрам: рассуждение, мультимодальность, код и работа с длинным контекстом. Уже доступна в приложении Gemini и в AI Studio
Native Audio Output — теперь Gemini может не только понимать, но и говорить естественным голосом. Можно управлять тоном, акцентом и стилем речи. Работает на 24+ языках и умеет переключаться между ними на лету.
Project Astra — голосовой ассистент будущего. Это часть проекта Gemini Live, которая наделяет ИИ зрением, слухом и навыками реального действия. Проще говоря, ассистент не только отвечает на вопросы, но и сам выполняет задачи на устройстве, как полноценный секретарь.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Agent Mode и Project Mariner: Agent Mode позволяет ИИ сам разбивать ваш запрос на шаги, лазить по интернету за свежими данными, вызывать нужные инструменты и даже выполнять последовательности действий за вас.
Project Mariner — это возможность для Gemini использовать компьютер как человек: открывать программы, нажимать кнопки, заполнять формы. Компании уже вовсю тестируют эту функцию.
Отдельно поиск прокачали:
AI-режим Google (пока в США). Когда вы что-то ищете, теперь можно переключиться во вкладку “AI”, и вы получите развернутый ответ от ИИ прямо над обычными результатами. Превращает привычный поиск в умного собеседника, который разжёвывает информацию специально для вас.
Personal Context - персонализированный поиск. Если вы захотите, ИИ сможет учитывать ваши собственные данные при формировании ответа. Первым делом подключили Gmail: можно разрешить поисковому ИИ просматривать вашу почту (и другие приложения в будущем тоже подтянутся – например, Календарь, Документы и т.д.). ИИ прошерстит ваши поисковые запросы, почту, и выдаст вам ответ именно под вашу ситуацию.
Виртуальная примерка одежды прямо в поиске: вы находите товар (платье, рубашку, брюки — сейчас поддерживаются эти категории), и видите значок "Try On" («Примерить»). Нажимаете, загружаете своё фото в полный рост, и за несколько секунд ИИ наложит выбранную вещь прямо на вас на фото. Учтёт вашу фигуру, позу, освещение, и как ткань платья будет драпироваться именно на вашем теле. Google говорит, что разработала специальную модель генерации изображений для моды, которая понимает нюансы одежды — как тянется материал, как складки ложатся на разных типах тел. Пока функция запущена экспериментально в США (через Search Labs), база поддерживаемых товаров огромна – миллиарды позиций из каталога Google Shopping. Вдобавок к этому Google анонсировала “умный чек-аут”: ИИ сможет следить за ценами на товар, и как только цена упадёт до желаемой, сам положит товар в корзину на сайте магазина и начнёт оформление заказа – вам останется лишь подтвердить и оплатить
Безопасность — Google значительно усилил защиту от непрямых инъекций промптов и других угроз.
Продолжение в моем канале НейроProfit


Тестируется черный и зеленый варианты, и оба будут без грустного смайлика и QR-кода со ссылкой на возможные фиксы — только рекомендация сделать перезапуск.
Обновление выйдет до конца года.



По многочисленным слухам, дизайн системы (а также для Mac и iPad) получит особый «стеклянный» интерфейс, а также кучу новых анимаций.
Хотели бы такой редизайн или лучше оставить как есть?
Будут как бесплатные фильтры, так и доступные только по Discord Nitro.
Обнову должны выкатить в ближайшее время.
Научиться создавать крутые изображения https://neuralprofit.ru/


ChatGPT o1 вышла на замену ChatGPT o1 preview, считавшейся самой продвинутой. Теперь можно загружать изображения, ответы стали быстрее на 60%, улучшилось написание кода и решение математических задач.
Так же вышла ChatGPT o1 Pro - самая мощная модель за 200$ в месяц для топов в своем деле, которым нужен качественный анализ больших данных или стратегическое планирование, и они готовы за это платить, и главное, это окупается.
Что дает подписка за 200 баксов пользователям для рядовых задач? Разве что обход ограничений. OpenAI так стимулируют купить подписку, что теперь для тарифов Plus и Team ввели ограничения: в o1 доступно 50 сообщений в неделю; в o1-mini доступно 50 сообщений в день. Еще и безлимитную Sora, об этом ниже.
Более подробно, как использовать ChatGPTдля своих задач и правильно составлять промпты мы учимся в Закрытом сообществе Нейроучеба. Там же вы научитесь применять нейросети для работы и учебы. Присоединяйтесь к сообществу единомышленников сегодня!
OpenAI наконец-то официально выпустили - Sora - перед нажатием убедитесь, что вы в США и других странах (кроме ЕС, Великобритании и Китая). До этого многие уже начали сомневаться, а существует ли она в природе? Или дадут ли ее обычным пользователям, а не только киностудиям?
Почему все так ждали этот видеогенератор, и почему он такой революционный, я рассказала здесь.
– Создавать видео по текстовому промту и анимировать изображения
– Комбинировать два видео
Подробнее про эти функции я рассказала здесь
Доступ постепенно дают платным пользователям ChatGPT, естественно с лимитом в 50 генераций. Но мне, в данный момент не удалось создать учетку и попробовать, потому что:
Создание учетной записи Sora временно недоступно. В настоящее время мы испытываем большую нагрузку и временно отключили создание учетных записей Sora. Если вы еще ни разу не входили в Sora, пожалуйста, зайдите на сайт в ближайшее время.
Помимо впечатляющих примеров видео на сайте Sora есть крутые видео с промтами и советами на сайте OpenAi , где они подробно рассказали про новую модель, про лимиты тарифных планов ChatGPT - куда включена теперь и Sora, забегая вперед скажу, что качество в 1080p и без вотермарок скачать видео вы сможете только за 200$, а за 20$ извольте получить только 720p.
Где доступна Sora: США и другие страны (кроме ЕС, Великобритании и Китая).
В общем, есть над чем подумать, за 200 $/месяц и безлимит на Sora и суперумная модель ChatGPT в придачу, или пока оставаться на 20$. И если ChatGPT o1 реально нужен пока не столь большому числу людей, остальные прекрасно для своих задач будут использовать ChatGPT за 20$, то безлимитная Sora нужна всем, кто профессионально связан с производством видеоконтента, это уже вопрос конкурентоспособности
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Помните нашумевший видеогенератор Vidu?
Кто не помнит, вот мой подробный обзор
Он позволяет создавать ролики с вашим лицом (ну или не совсем с вашим), можно даже фото знаменитости загрузить. Так вот, сервис обновился до версии 1.5.
Более стабильный вывод видео с более насыщенными деталями и улучшенной четкостью в разрешениях 720p и 1080p.
Функция генерации сцен с любым объектом, заданным по образцу
Модель теперь лучше понимает промпт и различные техники работы с камерой, включая движения, ракурсы и специальные приемы.
Можно управлять движением. Легко настраивайте амплитуду движений в ваших видео. Можно сделать анимацию более плавной или добавить больше динамичных сцен и движений
Reference to Video — можно создать видеоролики, которые соответствуют эталонным объектам - персонажам, предметам и окружению. Загрузите изображение объекта и введите текст, чтобы начать создание видео. Видео будет с этим объектом. Можно использовать вместе с функцией согласованности нескольких объектов - MultiEntity Consistency, о ней отдельно
MultiEntity Consistency - можно указать больше одного объекта в качестве референса для видео. Добавьте несколько объектов или изображения одного объекта с разных ракурсов, чтобы обеспечить единство сюжета в видео. Например, можно загрузить банку с газировкой, изображение зимнего парка и изображение девушки и прописать запрос: девушка с банкой газировки идет по зимнему парку
Расширенные стили аниме
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Бесплатно дают 80 кредитов в месяц, которых хватит на 20 видео (по 4 секунды).
Больше полезных сервисов для учебы и работы, а так же, как их использовать и все подводные камни вы найдете в моем Закрытом клубе НейроУчеба