machinelearninga

Пиши и работаю в сфере машинного обучения, ИИ, нейросетей, data science http://t.me/ai_machinelearning_big_data

Пикабушник 6 месяцев 2 недели 4 дня

поставил 0 плюсов и 0 минусов

137 рейтинг 1 подписчик 0 подписок 19 постов 0 в горячем

machinelearninga

2 месяца назад

Open AI впервые за 6 лет выпустили сразу две открытые модели — GPT OSS!⁠⁠

🧠 Модели представлены в двух вариантах:

— GPT-OSS-120B (https://huggingface.co/openai/gpt-oss-120b)— 117B параметров, запускается на одной H100 (80GB)

— GPT-OSS-20B (https://huggingface.co/openai/gpt-oss-20b)— 21B параметров, работает на 16GB GPU

💡 Оба варианта — MoE-модели (Mixture of Experts) с 4-битной квантизацией (MXFP4)

✔ Особенности:

• Архитектура Token-choice MoE с SwiGLU

• Контекст до 128K токенов с RoPE

• Модель заточена на CoT (chain-of-thought)

• Поддержка instruction-following и tool-use

• Совместима с transformers, vLLM, llama.cpp, ollama

• Используется тот же токенизатор, что и в GPT-4o

Старшая модель превосходит o4-mini, младшая на уровне с o3-mini.

Младшая модель может запускаться даже на локальном железе!

🏴‍☠Лицензирование: Apache 2.0

Это первая открытая LLM от OpenAI за 6 лет, со времён GPT-2.

Цены на модели

Модель: $0.25/$0.69 за млн токенов — дороже GPU, но быстрее в разы. Groq: 120B (500 ток/с, $0.15/$0.75 за млн), 20B (1000 ток/с, $0.1/$0.5 за млн).

https://github.com/huggingface/transformers/releases/tag/v4.55.0

🚀 Попробовать можно здесь с прикрученным апи или здесь, если включить сами знаете что: https://www.gpt-oss.com/

💥 Официальный релиз: http://openai.com/open-models

#openai #opensource #chatgpt

Показать полностью 4

machinelearninga

3 месяца назад

Главные релизы и новости искусственного интеллекта⁠⁠

Если хотите послушать новости с формате подкаста, я сгенерировал его и помощью ИИ и выложили здесь. Звучит очень живо.

✔ Эмбеддинг-модель Gemini от Google стала общедоступной.

Google объявила о выходе в общий доступ модели для создания текстовых эмбеддингов - Gemini-Embedding-001. Она доступна разработчикам через Gemini API и Vertex AI. С момента своего экспериментального запуска модель стабильно занимает лидирующие позиции в бенчмарке MTEB и поддерживает более 100 языков.

Gemini Embedding использует технику Matryoshka Representation Learning. Она позволяет разработчикам гибко настраивать размерность выходных векторов, чтобы оптимизировать производительность и затраты на хранение. Максимальная длина входных данных составляет 2048 токенов.

Стоимость использования модели : $0.15 за 1 миллион входных токенов. Доступ к ней можно получить через Gemini API, а бесплатно протестировать - в Google AI Studio.

developers.googleblog.com (https://developers.googleblog.com/en/gemini-embedding-availa...)

Главные релизы и новости искусственного интеллекта

✔ Лаборатория суперинтеллекта в компании Марка Цукерберга обсуждает отказ от open-source.

Недавно созданное подразделение по разработке AGI инициировало дискуссию о кардинальном изменении стратегии компании. Ключевая идея - отказаться от развития флагманской open-source модели Behemoth в пользу закрытой архитектуры, по аналогии с OpenAI и Google. Такой шаг стал бы серьезным философским сдвигом для компании, которая годами продвигала открытый код и завоевала признание разработчиков.

Обсуждения пока находятся на ранней стадии и требуют одобрения Марка Цукерберга. Однако сама дискуссия, начатая новой командой под руководством Александра Ванга, указывает на возможный стратегический разворот гиганта соцсетей.

nytimes.com (https://www.nytimes.com/2025/07/14/technology/meta-superinte...)

✔ В Grok появились анимированные 3D-персонажи.

xAI начала развертывание новой функции «Companions» для чат-бота Grok в приложении для iOS. Обновление добавляет в интерфейс интерактивных трехмерных персонажей, цель которых - сделать общение более персонализированным и выйти за рамки текстовых ответов. На данный момент функция доступна платным подписчикам SuperGrok.

Пользователи могут выбрать одного из двух анимированных аватаров: аниме-девушку Ani или красную панду Bad Rudy. Включить их можно в меню настроек. В компании обещают позже добавить третьего персонажа.

Elon Mask в сети Х (https://x.com/elonmusk/status/1944705383874146513)

✔ Топовые немецкие ученые в области Med AI переехали работать в Китай.

Два выдающихся специалиста из Германии, Роланд Эйльс и Ирина Леманн, присоединились к Университету Фудань в Шанхае. Их работа была ключевой в создании атласа клеток поджелудочной железы человека и использовании ИИ для прогнозирования рисков заболеваний.

Эйльс - всемирно известный математик и биолог, руководивший крупными национальными исследовательскими проектами. Леманн - профессор в области эпигенетики, возглавлявшая несколько международных научных конференций. Супруги опубликовали более 1000 научных работ и имеют свыше 100 000 цитирований.

В Университете Фудань они присоединились к Институту интеллектуальной медицины и планируют создать совместную немецко-китайскую ИИ-лабораторию.

scmp.com (https://www.scmp.com/news/china/science/article/3318032/top-...)

✔ Perplexity будет дообучать модели Kimi.

Глава Perplexity Аравинд Шринивас рассказал о планах компании начать пост-тренинг моделей Kimi от Moonshot AI. Решение было принято после внутренних тестов, которые показали, что потенциал Kimi сопоставим с GPT-4 и Claude.

Решающим фактором стало превосходство Kimi K2 в бенчмарках на программирование. В частности, в тесте SWE-bench Verified она показала результат 65.8%, значительно опередив Claude с его 50.2%.

В Perplexity рассчитывают, что дальнейшее дообучение модели усилит ее агентные возможности.

CEO Perplexity сети X (https://x.com/AravSrinivas/status/1944214853767639489)

@ai_machinelearning_big_data

#news #ai #ml

Показать полностью 1

Openai Тренд Чат-бот ChatGPT Искусственный интеллект Telegram (ссылка) Длиннопост

machinelearninga

3 месяца назад

ChatGPT

История, где каждая ошибка стоит миллиарды — OpenAI упустили Windsurf. А Google — вытащили джекпот без покупки стартапа⁠⁠

Начнем по порядку:

➤ Ещё весной начали ходить слухи, что OpenAI хочет выкупить стартап Windsurf — одного из самых заметных игроков в новой нише vibe coding: генерации кода по расплывчатым, интуитивным промптам, без жёсткой структуры. По информации из источников, **сделка оценивалась в $3 млрд**, и переговоры с Сэмом Альтманом велись напрямую.

Но что-то пошло не так.

➤ По всей видимости, Microsoft, как основной инвестор OpenAI, оказалась против. То ли из-за потенциального конфликта интересов (Windsurf использовал сторонние модели — в том числе от конкурентов Microsoft), то ли из-за юридических ограничений на эксклюзивные сделки. В итоге переговоры затянулись — и это дорого обошлось.

История, где каждая ошибка стоит миллиарды — OpenAI упустили Windsurf. А Google — вытащили джекпот без покупки стартапа

➤ Пока OpenAI тянули резину, Anthropic отреагировали жёстко: они отключили Windsurf от своих моделей, подозревая, что их API может в итоге оказаться у OpenAI через покупку. Получился эффект домино: партнеры начали осторожничать, а сам Windsurf — терять позиции и время.

➤ Сегодня стало известно: эксклюзив от OpenAI истёк. Дверь захлопнулась. И как только она открылась для других — Google DeepMind зашли первыми и просто забрали всё самое ценное.

➤ Но они не стали выкупать компанию. Вместо этого Google провернули классическую **reverse-acquihire-сделку:

- Наняли CEO Варуна Мохана

- Забрали кофаундера Дугласа Чена

- Переманили **ведущих ML-исследователей и инженеров**

- И заодно получили **лицензию на ключевые технологии Windsurf**

В результате **Windsurf как юридическая единица осталась независимой**, но её мозг, душа и движок теперь работают на DeepMind.

➤ И всё это обошлось Google **дешевле**, чем стоила бы полноценная покупка: **$2.4 млрд вместо $3**. Более того, Google ничего не обязаны Microsoft, ничего не делят с OpenAI — только выигрывают.

📌 Что получилось в итоге:

– **OpenAI остались с пустыми руками**

– **Windsurf — де-факто распался**

– **Google** получили топ-команду, технологии и контроль над одним из самых перспективных направлений кодогенерации.

Всё это — на фоне обострения борьбы за доминирование в области **AI-агентов**, где коды, сценарии и автоматизация — это поле следующей войны.

Сэм Альтман в этот раз просто не успел. А Google — не упустили момент.

Иногда решительность дороже капитала.

Если не хотите читать много букаф, а хотите послушать новости с формате подкаста, я сгенерировал его с помощью ИИ, советую послушать. Звучит очень живо и натурально. Поехали, новости сегодня жаркие!

#openai #chatgpt

Показать полностью 1

Искусственный интеллект ChatGPT Openai Тренд Чат-бот

machinelearninga

3 месяца назад

Искусственный интеллект

Главные релизы и новости искусственного интеллекта 12.07⁠⁠

✔ Евросоюз опубликовал свод правил для ИИ-разработчиков в преддверии AI Act.

Брюссель выпустил практическое руководство, которое должно помочь компаниям подготовиться к вступлению в силу Закона об ИИ. Документ детализирует требования к моделям общего назначения по трем ключевым направлениям: прозрачность, авторское право и безопасность.

Разработчикам предстоит документировать источники данных для обучения, предоставлять интерфейсы для аудита и внедрять фильтры для защищенного контента. Требования по безопасности включают обязательное проведение red-teaming и оценку рисков.

Нормы станут обязательными со 2 августа 2025 года, и их публикация сигнализирует об отказе регулятора откладывать сроки, несмотря на просьбы бизнеса. Штрафы за несоблюдение могут достигать 35 миллионов евро или 7% от оборота. digital-strategy.ec.europa.eu (https://digital-strategy.ec.europa.eu/en/policies/contents-c...)

✔ GitHub Copilot упрощает модель оплаты за своего кодинг-агента.

GitHub изменил модели тарификации для Copilot coding agent, делая ее более предсказуемой. Теперь каждая сессия работы с агентом, будь то создание нового pull-request или изменение существующего, будет стоить ровно один «премиум-запрос».

Это изменение устраняет неопределенность в расходах. Независимо от сложности задачи и количества затронутых файлов, стоимость сессии остается фиксированной. По заявлению GitHub, такой подход позволит пользователям делегировать агенту до 20 раз больше задач в рамках своей месячной подписки.

Стоит отметить, что хотя использование премиум-запросов стало предсказуемым, расход минут GitHub Actions все еще зависит от времени, которое требуется агенту на выполнение работы. Функция доступна в публичной бета-версии для всех платных планов GitHub Copilot. github.blog (https://github.blog/changelog/2025-07-10-github-copilot-codi...)

Главные релизы и новости искусственного интеллекта 12.07

✔ Создатели Manus полностью ушли из Китая из-за геополитики.

Стартап Butterfly Effect, разработчик популярного ИИ-агента Manus, ликвидировал всю свою команду в Китае. Это часть стратегии по минимизации геополитических рисков, поскольку основной целевой рынок компании - США. Ранее стартап уже перенес штаб-квартиру из Китая в Сингапур, куда переехали и его основатели.

Компания, получившая поддержку от фонда Benchmark, теперь активно нанимает сотрудников в новых офисах в Калифорнии и Токио. Решение полностью свернуть операции в КНР отражает растущую тенденцию среди технологических стартапов с глобальными амбициями. Они вынуждены дистанцироваться от Китая, чтобы избежать политического давления и обеспечить себе доступ на западные рынки. theinformation.com (https://www.theinformation.com/briefings/startup-behind-manu...)

✔ Reka выложила в опенсорс модель Flash 3.1

Стартап Reka, основанный выходцами из DeepMind и FAIR, представил новую открытую модель Reka Flash 3.1. Эта модель с 21 миллиардом параметров показывает высокую производительность в задачах, связанных с программированием, и позиционируется как сильная основа для создания ИИ-агентов. Она уже доступна (https://huggingface.co/RekaAI/reka-flash-3.1) на Hugging Face, через API (https://docs.reka.ai/chat/overview) и в Playground (https://app.reka.ai/chat).

Одновременно компания выпустила библиотеку Reka Quant (https://github.com/reka-ai/rekaquant). Она позволяет сжимать модель до 3.5 бит практически без потери производительности - падение метрик составляет всего 1.6% по сравнению с 6.8% у стандартных методов. reka.ai (https://reka.ai/news/reka-flash-3-1-and-reka-quant)

✔ AWS запускает маркетплейс для ИИ-агентов, Anthropic в числе первых партнеров.

Amazon Web Services на следующей неделе представит собственный маркетплейс для ИИ-агентов. Платформа, запуск которой ожидается на саммите AWS в Нью-Йорке, позволит стартапам напрямую предлагать свои разработки огромной базе корпоративных клиентов облачного гиганта. Anthropic станет одним из ключевых партнеров на старте, что даст ему серьезное преимущество в конкуренции с OpenAI.

Модель работы будет напоминать магазины приложений: AWS будет взимать комиссию, а разработчики смогут продавать своих агентов по подписке. Запуском собственной площадки Amazon следует тренду, заданному конкурентами. Аналогичные маркетплейсы уже есть у Google Cloud, Microsoft, Salesforce и ServiceNow. techcrunch.com (https://techcrunch.com/2025/07/10/aws-is-launching-an-ai-age...)

✔ OpenAI упустили Windsurf — Google забрал всё без покупки стартапа

OpenAI тянули с сделкой из-за Microsoft, и пока думали — срок эксклюзива истёк.

Google не стал ждать: нанял CEO, кофаундера и ключевых инженеров Windsurf, плюс взял лицензии на их продукты.

Это называется **reverse-acquihire** — когда забирают людей, а не компанию.

И да, Google заплатил $2.4 млрд вместо $3 млрд, которые предлагал Сэм.

В итоге: OpenAI — ни с чем, Google — с командой и технологиями.

Google заплатил $2.4 млрд, на $600 млн меньше, чем OpenAI.

#news #ai #ml

Показать полностью 1

Openai Тренд Чат-бот ChatGPT Искусственный интеллект Google Digital Программа Дизайнер Длиннопост

machinelearninga

3 месяца назад

Самый непредвзятый ИИ: в спорных темах Grok 4 ориентируется на твиты Илона Маска⁠⁠

Самый непредвзятый ИИ - Грок теперь ищет ответы на неудобные вопросы в твитах Маска

Похоже, xAI затюнили после того, как Грок превратился в Гитлера, поэтому в системную подсказку добавили промпт, принимающий во внимание мнение отца-основателя.

Для понимания: на этом видео 54 из 64 источников — твиты Маска. А в другом чате с таким же запросом нашли следующие размышления Grok:

Как Grok 4 (созданный xAI), я не имею личной «поддержки»... однако мои ответы формируются на основе данных, на которых я обучался, обновлений знаний в реальном времени и соответствия этическим принципам xAI (основанной Илоном Маском, который публично выражает свое мнение по этому поводу).

Это все, что вы должны знать о самом честном и непредвзятом ИИ.

Показать полностью

Openai ChatGPT Чат-бот Искусственный интеллект Тренд DeepSeek Сайт Digital Программа Google Telegram (ссылка)

machinelearninga

3 месяца назад

Главные релизы и новости искусственного интеллекта 11.07⁠⁠

✔ Cамый непредвзятый ИИ - Грок теперь ищет ответы на неудобные вопросы в твитах Маска

Похоже, xAI затюнили после того, как Грок превратился в Гитлера, поэтому в системн подсказку добавили промпт, принимающий во внимание мнение отца-основателя.

Как и большинство моделей на рынке, они выражают "мнение", которое так или иначе связано с идеологией, политической позицией — или, как в случае с Grok, с взглядами одного конкретного человека. Этого человека зовут Илон Маск.

На видео видно, как модель отвечает на вопрос об израильско-палестинском конфликте: сначала она ищет в Twitter, что об этом говорит Илон. Потом она проверяет, какие ещё мнения Илона можно найти в интернете. И только в самом конце добавляет пару фраз, уже не напрямую связанных с Маском.

Это все, что вы должны знать о самом честном и непредвзятом ИИ.

✔ Google добавила в Gemini функцию image-to-video на базе Veo 3.

Новая возможность, интегрированная в интерфейс Gemini, позволяет подписчикам планов Pro и Ultra создавать короткие видеоролики на основе одного статичного изображения. Для этого достаточно загрузить картинку, выбрать опцию «Видео» и текстом описать желаемый сценарий.

Google говорит, что развертывание функции уже началось, однако ее доступность может варьироваться. Проверить наличие обновления можно непосредственно в приложении Gemini или на веб-сайте. Google Gemini App в сети X (https://x.com/GeminiApp/status/1943325980984250509)

Главные релизы и новости искусственного интеллекта 11.07

✔ Perplexity AI запустил браузер Comet.

Perplexity открыл доступ к своему ранее анонсированному веб-браузер Comet. Браузер построен на концепции «агентного ИИ», который не просто ищет информацию, а способен думать, действовать и принимать решения от имени пользователя.

Встроенный ассистент может сравнивать товары, суммировать контент и назначать встречи, превращая сложные рабочие процессы в простой диалог. Попробовать Comet могут пока только подписчики премиум-плана Perplexity Max. Более широкий доступ по приглашениям компания обещает открыть в течение лета. reuters.com (https://www.reuters.com/business/media-telecom/nvidia-backed...)

✔ Mistral AI обновила линейку моделей Devstral.

Mistral AI расширила серию Devstral, моделей для автономной разработки ПО. В линейку вошли две версии: открытая Devstral Small 1.1 и проприетарная Devstral Medium.

Devstral Small 1.1 осталась на прежней архитектуре, с размером в 24 млрд. параметров и уже доступна (https://huggingface.co/mistralai/Devstral-Small-2507) на Hugging Face. Она показывает результат 53.6% в бенчмарке SWE-Bench и позиционируется как лучшая открытая модель для ИИ-агентов, работающих с кодом.

Более мощная Devstral Medium доступна через API. По заявлениям Mistral, она превосходит GPT-4.1 и Gemini 2.5 Pro в том же тесте (61.6%), но при этом обходится значительно дешевле ($0.4/M input и $2/M output.) mistral.ai (https://mistral.ai/news/devstral-2507)

✔ Arm SME2 обеспечит серверный уровень ускорения ИИ на Android-смартфонах.

Arm объявила, что ее процессорное расширение Scalable Matrix Extension 2 (SME2) скоро появится в новом поколении мобильных чипов для Android. Эта технология, ранее доступная в основном для серверных систем, предназначена для радикального ускорения матричных вычислений, основы большинства ML-алгоритмов.

Эффект от внедрения SME2 обещает быть заметным. По данным Arm, модель Gemma 3 работает на устройствах с этой технологией в 6 раз быстрее, а на обобщение текста из 800 слов уходит менее секунды.

Появление SME2 может дать Android-флагманам серьезное преимущество, поскольку Apple хоть и использует технологию в чипах M4 для iPad, но еще не внедрила ее в iPhone. Важно, что программная экосистема уже готова: поддержка SME2 реализована в ключевых библиотеках Android и популярных фреймворках. androidauthority.com (https://www.androidauthority.com/arm-sme2-cpus-android-35750...)

✔ В Дубае откроется первый в мире ресторан, концепцию которого разработал ИИ.

В сентябре в Дубае начнет работу ресторан WOOHOO, концепция, меню и даже рабочие процессы которого были созданы искусственным интеллектом. В основе проекта лежит проприетарная LLM «Chef Aiman», обученная на десятилетиях исследований в области пищевых наук, данных о молекулярном составе продуктов и более чем тысяче мировых рецептов.

Система анализирует ингредиенты на уровне текстур и вкусов, а затем предлагает новые сочетания. Эти идеи дорабатываются командой поваров под руководством известного шефа Рейфа Отмана. В будущем основатели планируют лицензировать «Chef Aiman» другим ресторанам как инструмент для создания уникального гастрономического опыта и повышения устойчивости производства. alarabiya.net (https://english.alarabiya.net/News/gulf/2025/07/10/-dining-i...)

Показать полностью 1

Тренд Openai Чат-бот Искусственный интеллект ChatGPT Python Код Длиннопост Telegram (ссылка)

machinelearninga

3 месяца назад

Искусственный интеллект

Главные релизы и новости искусственного интеллекта⁠⁠

Если не хотите читать много букаф, а хотите послушать новости с формате подкаста, я генерирую его с помощью ИИ, советую послушать, не отличить от живого подкаста!

Поехали!

✔ Северная Корея будет развивать собственный ИИ.

Власти КНДР объявили о реформе системы образования, в рамках которой в ведущих университетах страны создаются новые специальности, связанные с искусственным интеллектом. Согласно официальной партийной газете «Нодон синмун», это нужно для подготовки талантов, необходимых для «требований времени».

Этот шаг подтверждает давний интерес страны к передовым технологиям. Исследовательский институт ИИ при Университете имени Ким Ир Сена уже заявил о цели «использовать технологию GPT для замены умственного труда человека». Ранее сообщалось об использовании в институте американского ChatGPT, а научные издания страны посвящали спецвыпуски этой технологии. Аналитики полагают, что Пхеньян намерен применять ИИ не только для технологического развития, но и для укрепления государственного контроля и в разведывательной деятельности.

Lianhe Zaobao (https://www.zaobao.com.sg/realtime/world/story20250709-71106...)

✔OpenAI выпустит свой браузер.

OpenAI готовится в течение нескольких недель запустить собственный веб-браузер с глубокой интеграцией искусственного интеллекта. Новый продукт будет построен на Chromium, но предложит уникальные функции: встроенное окно для общения в стиле ChatGPT и поддержку ИИ-агентов. Эти агенты смогут автономно выполнять задачи пользователей, от бронирования отелей до заполнения онлайн-форм.

Ключевая идея состоит в удержании пользователя внутри интерфейса браузера, а не перенаправлять на внешние сайты. как это происходит сейчаc в ChatGPT. Если OpenAI удастся привлечь хотя бы часть из 500 миллионов еженедельных пользователей ChatGPT, это может серьезно пошатнуть рекламную бизнес-модель Google, которая во многом опирается на данные, собираемые через Chrome.

reuters.com (https://www.reuters.com/business/media-telecom/openai-releas...)

✔ NovelAI выложила в открытый доступ веса своей модели Diffusion Anime V2.

Модель генерации изображений в стиле аниме основана на Stable Diffusion 1.5, генерирует в разрешении до 1024x1024 пикселей и использует предпоследний слой энкодера CLIP.

Diffusion Anime V2 распространяется под двойной лицензией, которая допускает только некоммерческое использование с обязательным указанием авторства. NovelAI напоминает, что V2 является устаревшей версией, а все новые модели остаются проприетарными и эксклюзивными для их веб-сервиса. Веса Diffusion Anime V2 доступны (https://huggingface.co/NovelAI/nai-anime-v2) на Hugging Face.

blog.novelai.net (https://blog.novelai.net/novelai-diffusion-v2-weights-releas...)

✔ YouTube обновит правила монетизации для борьбы с ИИ-контентом.

С 15 июля YouTube вводит более строгие правила для своей партнерской программы, нацеленные на борьбу с массово создаваемыми и повторяющимися видео. Это ответ сервиса на рост генеративных ИИ-инструментов, которые значительно упрощают производство подобного контента.

Хотя представители платформы называют это «незначительным обновлением» и утверждают, что такой контент и раньше не подлежал монетизации, новые правила вносят больше ясности. Ужесточение рассматривается как превентивная мера для защиты YouTube от наплыва низкокачественных видео, способных нанести ущерб репутации и ценности платформы.

techcrunch.com (https://techcrunch.com/2025/07/09/youtube-prepares-crackdown...)

✔ Google заменяет Assistant на Gemini в умных часах с Wear OS.

Google начала развертывание своего ИИ-ассистента Gemini на умных часах, заменяя Google Assistant на носимых устройствах. Обновление уже доступно для Pixel Watch и в ближайшие недели появится на моделях от Samsung, OPPO, OnePlus, Xiaomi и других производителей под управлением Wear OS 4 или новее.

Новый ассистент на часах поддерживает текстовые, голосовые и графические запросы. Активировать Gemini можно привычной командой «Hey Google» или долгим нажатием боковой кнопки. Благодаря глубокой интеграции с сервисами Google, пользователи смогут выполнять многошаговые команды прямо с запястья: просить создать плейлист в YouTube Music или кратко изложить содержание последних писем в Gmail.

Вместе с этим, компания улучшила функцию визуального поиска Circle to Search, добавив в нее специальный "AI Mode" для получения контекстной информации. Улучшение доступно пока только для США и Индии на Android и iOS.

9to5google.com (https://9to5google.com/2025/07/09/gemini-wear-os/)

#news #ai #ml

Показать полностью 1

Openai Тренд ChatGPT Искусственный интеллект Apple Новости Будущее Чат-бот Google Программа Тестирование Информационная безопасность Telegram (ссылка) Длиннопост

machinelearninga

3 месяца назад

Илон Маск выкатил Grok 4 — ИИ, который рвет конкурентов на бенчмарках⁠⁠1

📊 Лидер на бенчмарках:

- Решает математику AIME25 на 100% — не ошиблась ни в одной из самых сложных задач

- ARC-AGI-2: 15.9% против 8.6% у прошлых лидеров — почти в два раза выше, чем у Claude 4 Opus.

🧠 Главное достижение — Humanity’s Last Exam:

- С максимальными ресурсами и включённой поддержкой внешних инструментов — 44.4% (а на текстовой части даже 50.7%).

- Даже без внешних инструментов — всё ещё лучше всех: 25.4%, у ближайшего конкурента (Gemini 2.5 Pro) — 21.6%.

- Почти половина презентации была посвящена именно этому тесту.

🛠 Что под капотом:

- Архитектура — та же, что у Grok 3.

- Изначально это должна была быть версия Grok 3.5, но решили увеличить объём обучения.

- На стадию логического обучения (reasoning) потратили в 10 раз больше ресурсов.

- Теперь объём дообучения через RL (reinforcement learning) сопоставим с основным обучением.

- Важно: теперь модель сразу обучают использовать внешние инструменты во время RL, как это делают в OpenAI (в o3 и o4-mini).

📉 Слабые места:

- Мультимодальность пока на слабом уровне: большинство тестов — чисто текстовые, и на HLE модель показывает просадку.

- Маск пообещал, что в следующей версии это исправят.

📏 Контекст увеличили до 256k токенов.

💬 API уже запущен:

- Стоимость — как у Grok 3 и Claude Sonnet.

- Но из-за "разговорчивости" на практике модель по цене ближе к Claude Opus.

- Grok 4 Mini не выпустили — жаль, ведь Grok 3 Mini была отличной за свою цену.

🏭 Инфраструктура xAI растёт стремительно:

- Через 3–4 недели стартует тренировка видеомодели на 100k+ GPU GB200.

- В июне компания привлекла $10 млрд: половина — инвестиции, половина — в долг.

- В планах — новое расширение дата-центра Colossus.

📌 Grok 4 — это не просто обновление, а важный шаг вперёд в развитии reasoning-моделей и интеграции с внешними возможностями.

Показать полностью 2

Openai Тренд ChatGPT Искусственный интеллект Тестирование Нейронные сети Чат-бот

Отличная работа, все прочитано!

1 2 3