Nvidia доставили новенький суперкомпьютер Сэму Альтману. Это первая модель DGX H200 — равных ему по мощности не было в истории.
Под капотом у монстра мощность в 1 экзафлопс и 144 ТБ памяти — он может выполнять квинтиллион (число с 18-ю нолями) операций в секунду. Это в 12 700 (!) раз мощнее RTX 4090 Ti.
На DGX H200 Альтман планирует создать GPT-5, и нам действительно страшно, что получится.
💥 NVIDIA анонсировала выступление Дженсена Хуанга в рамках выставки Computex 2024.
💭 Генеральный директор компании выступит с докладом 2 июня текущего года, за три дня до старта основной части мероприятия. Всем желающим будет доступна прямая трансляция выступления на официальном YouTube-канале NVIDIA или в синхронном переводе на Youtube-канале ARCHiTECH.
🎫 Большая часть презентации будет посвящена ИИ, ведущей в новую промышленную революцию по взгляду Куртки. Вофициальном пресс-релизе отсутствуют упоминания геймерских видеокарт.
🤖 Есть шансы на анонс новых специализированных решений для дата-центров и серверов. В прошлом году Nvidia представила новые GPU Hopper и CPU Grace.
💭 Японская компания ELSA при сотрудничестве с любимчиком Nvidia Inno 3D выпустила трёхвентильную RTX 4080 Super в двухслотовом исполнении.
🎫 Характеристики видеокарты следующие:
— габариты видеокарты 337 × 141 × 40 мм.
— площадь рассеивания в 670 656 мм2
— видеочип AD103 с 10 240 ядер CUDA
— тактовая частота видеочипа 2550 МГц
— TDP видеокарты 320 Вт
— 16 ГБ памяти GDDR6X
— 256 битная шина со скоростью в 23 Гбит/с
💰 Стоимость новой двухслотовой карточки - 1100$ США.
🤖 С учётом энергоэффективности архитектуры Ada Lovelace, у видеокарты можно скинуть 30-40% PL и получить холодную, тихую двухслотовую RTX 4080 Super или же вообще не париться и взять RTX 4070 Ti Super, которая лучше в соотношении цена-производительность. Можно также рассмотреть видеокарты от AMD RX 7800XT, RX 7900 GRE или RX 7900XT для ваших стримерских и игровых задач.
💥 Компания Intel представила множество новых продуктов, среди которых ИИ-ускорители Gaudi 3. По заявлениям создателей, они позволяют обучать нейросети в 1,7 раза быстрее, на 50 % увеличить производительность инференса и работают на 40 % эффективнее конкурирующих H100 от NVIDIA, которые являются самыми популярными на рынке.
💎 Intel также поделилась собственными тестами производительности, сравнив Gaudi 3 с системами на основе H100. Gaudi 3 справляется с обучением нейросетей в 1,5–1,7 раза быстрее. Сравнение велось на моделях LLAMA2-7B и LLAMA2-13B на системах с 8 и 16 ускорителями, а также на модели GPT 3-175B на системе с 8192 ускорителями. Intel не стала сравнивать системы на Gaudi 3 с системами на H200 от NVIDIA, у которого на 76 % больше памяти, а её пропускная способность выше на 43 %. При этом Intel заявляет о 2,6-кратном преимуществе в энергопотреблении по сравнению с H100.
Привет Пикабу! Вот такой агрегат (с не легкой судьбой) попал к нам в ремонт еще в декабре. Не сказать, что часто встречается. Штучка для профи. Но в игрушки особо не поиграешь, т.к. тут графика nVidia Quadro.
Видосик, по традиции, в конце поста. Там менее информативно, но более наглядно.
Предыстория ноутбука. Довольно длинная и имеет косвенное отношение к данному ремонту (можно пропустить).
Пришел, значит, данный ноутбук с жалобой: не включается.
Посмотрели. Реагирует на деформацию материнки в самом узком месте.
Все компоненты в этой области были пропаяны и отреболлены. Не помогло. Пришли к выводу, что где-то внутри платы межслойный обрыв. А учитывая, что мамка устанавливается в корпус и извлекается из него "со скрипом", то не удивительно, что ее могли повредить при выполнении этих действий. В таком случае ремонт, а точнее его попытка, крайне сомнительное мероприятие.
Ок. Но у клиента была еще одна плата, которую он заказал для замены. Но и она оказалась дефективной. Разбираемся с ней. Нашли незначительную проблему по питанию видеокарты. Восстановили. И вроде как все заработало. Но при тестах экран ноутбука гаснет и вертушки на макс обороты выходят. И опять же, реагирует плата на деформацию, но уже где-то между процессором и слотами ОЗУ. Если определенным образом изогнуть плату, то все в порядке - тесты крутятся.
В общем, у нее отваливаются каналы оперативной памяти. К слову, тут 4 слота, по 2 на каждый канал. И вот, то один отваливается, то второй. Пропаяли слоты - без результата. Думали на отвал проца. Отреболлили - без результата. Пересадили проц с первой платы - без результата.
Ну что жжж... Никак снова трещина. Фантастика. Ни разу за всю практику не встречалось такого совпадения. Но напомню, плата устанавливается и извлекается не так просто... Так что, возможно это и есть причина всех бед. К тому же, я уже подробно писал про процент не рабочих или не совсем рабочих материнских плат от различных китайцев. По нашей статистике: ~70% с косяками. А это статистика из пары-тройки сотен плат. Поэтому, берем платы только у местных поставщиков, с гарантией и беспроблемным возвратом/обменом.
Сообщили клиенту. Он решил заказать еще одну мать. Ок. Ждем...
Теперь к ремонту.
Получил клиент очередную плату и теперь она у нас. Установили. Помазали то, что должно быть помазано. Тестируем. Все хорошо. Вот только видеокарта (она тут полноценная - отдельная плата) отсутствует, в принципе. Ее просто нет. Ни в Винде, ни в Линуксе.
Квадрик отсутствует полностью =(
А видеокарту мы уже тестировали ранее в разных тестах на аналогичном ноутбуке. Она в полном порядке - без сомнений.
Что, опять мамка косячная? Ага, именно так! Но тут уже была надежда даже межслой починить. К чему я и был настроен.
Но все оказалось банальнее. Об этом и пост. Если бы погадал заранее, то и не снимал бы видос и не писал бы это все. Просто карты гадальные поломались, дали трещину. Но чтоб материалу не пропадать - пусть будет видос (в конце) и пост.
Питание видеокарты идет с мамки. Подключается отдельным шлейфом. На карту должно приходить 19 В. Но у нас по нулям:
К слову, видеокарта тут не привычная. Она подключается к материнке при помощи трех шлейфов, а не вставляется в слот.
Где же питание графики? Давайте разбираться...
19 В подается на видеокарту после открытия одного мосфета. Соответственно, на него должны приходить 19 В, чтобы он открывшись, пропустил питание на видеокарту. Замеряем вход мосфета:
19 В есть. А на выходе - 0. То есть, мосфет не открывается. Почему? Смотрим, приходит ли управляющий затвором сигнал и откуда он идет.
А он идет с еще одного транзистора, уже трехногого. И между двумя его ногами распаян резистор:
Замеряем сопротивление резистора:
А у нас тут почти по нулям. Может так и надо? Да не, замыкать ноги транзистора в ноль - это не по понятиям. Вопрос усложняется тем, что нет схемы на эту плату. И какой номинал у этого резистора мы не знаем. С виду же они все одинаковые... Но у нас есть мамка-донор, и даже две, и даже условно рабочие по этой части. Замерим что там...
А тут у нас 100 К. Вот это похоже на то, что должно быть. Вот и лайтовый ремонт, подумал я и снял транзюк и резюк. Но на них все в порядке. Транзюк в бесконечности, а резюк показал 100 К. Но вот контакты на плате все еще продолжают мне показывать КоЗу...
Так откуда же идет дереза? Взял я плату-донор и начал ее щупать полностью.
И знаете... даже через 1.5 часа был совсем не удовлетворен, а даже наоборот... Я прошелся по всем контактам, которые хоть как-то относятся к питанию. Сначала делал это оплеткой, по классическому методу, а потом, не поверив в результат, протыкал все контакты своим красным щупом. И аналогично оплетке, ничего не выщупал. Пора снова повышать градус, подумал я, и взял в руку фен. Затем посмотрел на мультик и снял его. И единственное место на мамке, куда приходит (а вернее, откуда) сигнал - это контакт под мультом. Вот он, в четвертом ряду:
И эта точка не в КЗ. Так что же это получается? Мульт сдох по одной из посредственных для него линий? Да никогда такого не было... Можете возразить... Типа, управление такими сигналами осуществляется ШИМами и Мультом, чего бы с них не начать? А я даже не знаю что вам ответить на это =) Я понимаю всё такое, но не терял надежду, вот и всё ) А еще, я больше всего ненавижу реболлить...
Скорее всего, предполагаю 2 варианта: 1. Попал какой-то мусор токопроводящий и замкнул контакты. К примеру, шарик припоя. Но не мог же он до четвертого ряда докатиться. Такие непослушные шарики, обычно, первый ряд останавливает; 2. Мульт уже снимали и замкнули соседние шарики при запайке. Но я прозвонил все соседние контакты и нигде нет минуса - всё вокруг сигнальные линии. Хоть Datasheet не смотри...
Чтобы проверить предположения нужно снять мультиконтроллер с рабочей (последней) материнки. Иначе мы ничего толком не узнаем...
Снимаем мульт:
И прозваниваем наш любимый контакт.
Тут под микроскопом
И я вижу бесконечность... Сопротивление отсутствует. Совсем.
Видно, что мульт ранее не снимали, стоит с завода. Мусора никакого нет. Я специально снимал его без флюса. Если бы что-то попало, было бы видно.
Да ладно... Просто мульт отъехал? Тогда зачем я все это снимал и пишу теперь? Я же думал, что будет КЗ в плате и даже придумал где просверлить плату и как ее обойти. Не повезло. Ну может кому интересно... =)
Взял я уже снятого, с донорской платы мульта. И начал искать трафарет. Из 4 универсальных и 2 очень похожих (от других мультов), ни один не подошел по "шагу" (расстоянию между шарами). Пришлось рукой катать шары. Чуть больше полу часа и шарики в лузах:
Картинки из видео. Некоторые не очень. Отдельно фото не делал - ленивый очень.
Зачищаю посадочное место на рабочей плате:
И сажаю мультик:
Возвращаю на место транзюк и резюк:
Смываем флюс. Замеряем сопротивление - 100 К. Включаем и замеряем напряжение - 19 В.
Запускаем... Проверяем... Тестируем...
Все в норме. Ремонт окончен.
Видео, как и обещал. Снимаю на телефон, одной рукой (вторая шары катает), времени нет для полноценной съемки на 3 камеры и монтажа. Кратно больше времени занимает. Извиняйте, пожалуйста ) Если на Пикабу не работает (это бывает в течении пары часов после публикации поста), то вот ссылка: https://youtu.be/9x7EZ7gC6R0?si=LeOzL3TyC17V8icR
На этом закругляюсь. Если зашло, ставьте плюс класс. Спасибо всем за внимание! Удачных ремонтов и честных мастеров!
----------------------------------------- Промышляю в Москве, на Комсомольской. Технику в ремонт принимаю из других локаций, но не дальше чем с Луны. Если есть вопросы не публичного характера, отвечу в ВК: https://vk.com/dmitry_okorokov или в Телеге @INERTICO и WhatsApp 89645505522 (ТОЛЬКО ЧАТ) e-mail: inertico@mail.ru Ну и буду рад оценке поста в комментариях.