Первый этап сборки кластера для ИИ
Как и обещал, начинаю рассказ про сборку/установку кластера на основе видеокарт NVIDIA Tesla. Данный кластер будет состоять из 31 вычислительной ноды и вспомогательных серверов.
В каждой вычислительной ноде 8 видеокарт, которые заточены именно под вычисления. Плюс 2ТБ NVMe PCI-e SSD (расположен прямо на шине PCI), и 100 Гб/с сетевой адаптер. Вот такой узел на фото ниже:
Красным - сетевой адаптер, зеленый - SSD.
Вспомогательные сервера - шлюзы для файловой системы GPFS, и другие ноды. У каждого шлюза - 4 порта по 16Гб/с FC, и 4 по 100 Гб/с сетевых. Фото не делал, ибо сил и времени уже не было.
на выходных всё это будет монтироваться в стойки.
Если получится, то итог тоже постараюсь выложить.