7

Qwen3-Next-80B-A3B новая модель от Alibaba

Alibaba только что выпустила Qwen3-Next-80B-A3B — новую локальную ИИ-мега-модель на Hugging Face!

Qwen3-Next-80B-A3B новая модель от Alibaba

Не просто ещё одна версия — это революция в эффективности:
— 80 млрд параметров
— Гибрид внимания Gated DeltaNet + Gated Attention — для более «бережного» чтения длинных промптов.
— High‑Sparsity MoE (Mixture of Experts — активируется лишь часть экспертов): коэффициент ~1:50.
— Многотокеновое предсказание (MTP) — ускоряет обучение/вывод.
— Нормализации и управление вниманием для стабильности.
— High-Sparsity MoE — рекордно низкие затраты на вывод
— 10x быстрее Qwen3-32B при контексте >32K токенов
— 10x дешевле в развертывании
Модель уже в мобильном приложении, вебверсии и на Hugging Face — открыта, бесплатно, для локального запуска.
Сравнение:Qwen3-32B → 100 токенов/сек
Qwen3-Next-80B-A3B → 1000+ токенов/сек на одном A100!
Аналитики говорят: Alibaba бросает вызов DeepSeek. Пока другие стагнируют из-за нехватки чипов — Alibaba делает модели, которые работают даже на слабых серверах.

Я рассказываю о ИИ-инструментах в Cherry Studio Club — канале о практиках применения ИИ. Подписывайтесь!

Искусственный интеллект

5.1K поста11.5K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан