7

Qwen3-Next-80B-A3B новая модель от Alibaba

Alibaba только что выпустила Qwen3-Next-80B-A3B — новую локальную ИИ-мега-модель на Hugging Face!

Qwen3-Next-80B-A3B новая модель от Alibaba

Не просто ещё одна версия — это революция в эффективности:
— 80 млрд параметров
— Гибрид внимания Gated DeltaNet + Gated Attention — для более «бережного» чтения длинных промптов.
— High‑Sparsity MoE (Mixture of Experts — активируется лишь часть экспертов): коэффициент ~1:50.
— Многотокеновое предсказание (MTP) — ускоряет обучение/вывод.
— Нормализации и управление вниманием для стабильности.
— High-Sparsity MoE — рекордно низкие затраты на вывод
— 10x быстрее Qwen3-32B при контексте >32K токенов
— 10x дешевле в развертывании
Модель уже в мобильном приложении, вебверсии и на Hugging Face — открыта, бесплатно, для локального запуска.
Сравнение:Qwen3-32B → 100 токенов/сек
Qwen3-Next-80B-A3B → 1000+ токенов/сек на одном A100!
Аналитики говорят: Alibaba бросает вызов DeepSeek. Пока другие стагнируют из-за нехватки чипов — Alibaba делает модели, которые работают даже на слабых серверах.

Я рассказываю о ИИ-инструментах в Cherry Studio Club — канале о практиках применения ИИ. Подписывайтесь!

Искусственный интеллект

5.2K постов11.5K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества