10

Сравнение производительности ИИ серверов в картинках для домохозяек

Многие пользуются чатами с ИИ. Решил сравнить чипы на чём это работает, сколько стоит. Дальше будут слайды.

Сравнение ИИ серверов на 2025.05 в FP16

Сравнение ИИ серверов на 2025.05 в FP16

Это 1 чип H200. Его скорость работы 1 ответ GPT-4o за ~1 секунду или 2 квадрилионов операций в секунду FP16. В чипе 141GB памяти.

ИИ чип

ИИ чип

Это по 1 ускорителю фирм N и A и они потребляют 700 и 750 Вт соответственно.

ИИ ускоритель

ИИ ускоритель

ИИ ускоритель

ИИ ускоритель

Это сервер и в нём 8 ускорителей. Стоит он, наверное, $280 и $100K соответственно для фирм N и A. Его скорость работы ~8 и ~5 ответов GPT-4o в секунду. И потребляет он ~7 кВт.

ИИ сервер

ИИ сервер

ИИ сервер

ИИ сервер

Это серверная стойка (5 racks) на 32 ИИ сервера или 256 ускорителей. Её скорость работы ~263 ответа GPT-4o в секунду. 36TB памяти HBM3e. И потребляет она 211 кВт. (Блоки питания на 600 кВт на сайте откуда картинка.) Стоит такая, наверное, от $10 млн.

ИИ стойка

ИИ стойка

Сравнивал для себя, выложил для всех. Данные для таблички искал ИИ. Если есть ошибки поправляйте как надо правильно.

FP16 в табличке - довольно точные вычисления, используются для обучения. Для запуски ИИ достаточно 8 bit, а это работает в 2 раза быстрее на всех ускорителях, кроме Intel.

Сравнивал не чтобы показать, что лучший суперкомпьютер МГУ медленнее и раз в 5 дороже шкафа от корпорации на букву I. Суперкомпьютеры умеют считать данные с повышенной точностью и у них бывают на порядок больше размеры дисков и другие возможности.
Например, у H200 скорость вычислений с точностью 16 бит - 2000 трлн оп/сек, 8 бит вдвое быстрее, а 32 бит в 30 раз медленнее и 64 бит в 60 раз медленнее. Возможно, что тест МГУ-270 был не в FP16. И цены 3 года назад были выше, а ускорители за 3 года сделали шаг вперёд.

Пруфы закреплю в комменте.

Про железо

1.7K постов3K подписчиков

Правила сообщества

1.Размещать информацию, связанную с тематикой сообщества в развёрнутом и максимально понятном виде. Изображения, схемы, графики, иллюстрации — приветствуются.


2. Пользователь не должен переходить по ссылкам на сторонние ресурсы чтобы дочитать публикацию.


3. Допускаются ссылки на сторонние ресурсы, если эти ресурсы представляют какую-либо ценность (например, это справочные материалы). То есть – ссылки только по делу, если без них не обойтись.


Давайте уважать друг друга. Оскорбления, мат, переход на личное – порицаются. Здоровая критика и обсуждения – приветствуются.

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества