9

Серверная платформа R2308GL4GS

День добрый, прошу не осуждать, за возможную глупость вопроса, но сам, увы, разобраться не cмог.
В распоряжении имеется серв с S2600GL4 платой, один проц Xeon E5-2620 2ГГц, один бп DPS-750XB A, видюх нет.
После некоторых (неизвестных мне) нюансов с питанием(возможно причина была иная), серв начал периодически переходить в режим "усиленного охлаждения", при том, что с нагрузкой на железо это никак не связано.
В System Acoustic and Performance Configuration, понижал Altitude, это отразилось только на скорости оборотов, он так же самопроизвольно ускоряет кулеры, но уже на меньшее количество оборотов. В логах инфы о событиях нет. Есть предположение, что проблема в БП, но диагностировать это никак не получается.
Подскажите пожалуйста, в чём может быть беда?

Лига Сисадминов

2.3K постов18.8K подписчиков

Правила сообщества

Мы здесь рады любым постам связанным с рабочими буднями специалистов нашей сферы деятельности.

0
Автор поста оценил этот комментарий

Нуу, они есть практически на всех блейдовых серверах с которыми я работал, даже на тех, которым больше 20 лет.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

понял, спасибо!

0
Автор поста оценил этот комментарий

Когда в прошлом году случилась подобная фигня, оказалось что погнал датчик закрытия корпуса. Там, по идее, если корпус открыт, сервак начинает усиленно гонять воздух, т.к. контур разомнкнут. Когда перепроверили (открыли полностью+закрыли поплотнее) глюки пропали.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

кста, трабл самолеквидировался и очень похоже, что проблема была примерно в этом
но я манипуляций прогнал довольно много и честно, хз с чем это связано и есть ли в этом серваке вообще такой датчик

показать ответы
1
Автор поста оценил этот комментарий

попробуй еще БП запустить отдельно от остального барохла (материнка, диски и т.п.).
Просто блок питания.
Если будет также взлетать, значит проблема в нем, что-то греется

раскрыть ветку (1)
1
Автор поста оценил этот комментарий
Идея хороша, но БП в данном случае нестандартный, нет 24 pin
как инициировать запуск БП отдельно в данном случае, хз экспериментировать не особо хочется, запасного нет
показать ответы
0
Автор поста оценил этот комментарий
А зря, продуть от пыли и заменить термопасту стоило сразу как только хотяб показалось что он греется
раскрыть ветку (1)
1
Автор поста оценил этот комментарий
Да, сделал, сделал
толку ноль
паста свежая была, серв не напрягается
4
Автор поста оценил этот комментарий

реально температуры мониторил? Может часть кулеров сдохла и у остальных обороты повышаются?

Переставить БП в другой слот не пробовал? Было недавно что в одном серваке отъехала плата распределения питания, в логах и ipmi было чисто, но сервак спонтанно вырубался. Причём мог на стресс-тесте отработать 6 часов, а по завершению через полчаса простоя вырубиться. У тебя смотрю БП прямо в мать втыкается и хрен знает как она там регулирует. Можно попробовать напряжения хотябы в молексах тестером замерить.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

При перемещении БП в другой слот, серв не выходит из режима "полёта", гонит кулеры на полную мощность, так проверил кулеры, все работают в едином порыве, никто не филонит. С температурами у проца всё ок, старя паста была жидкая

показать ответы
3
Автор поста оценил этот комментарий

set fan profile

и altitude на 0 поставь

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Спасибо, но увы, нулевых значений у этих параметров нет.

0
Автор поста оценил этот комментарий
Тогда проверяйте, у вас почти со 100% вероятностью умирает кулер какой-то. Кстати... Блок питания тоже может повлиять... Если сервер рассчитан на два блока питания, один умер, а второй работает на 80%, такое было тоже. Блоки питания у них вообще не дорогие. Их делает не Интел, а Дельта. Там два парт-номера. Один интеловский, а один дельтавский. Дельта легко покупается на алике. Заодно и проц поменяйте, он копейки стоит для вашей платформы, только внимательно читайте мануал по материнке и не берите проц, который имеет TDP выше дозволенного на плате
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

понял, спасибо!

0
Автор поста оценил этот комментарий

при помощи паяльника и резисторов. Не рекомендую.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

понял

1
Автор поста оценил этот комментарий
Беда может быть в том, что обновили прошивку, скачав ее именно со страницы материнской платы. Эта материнская плата используется в нескольких разных серверах, с разным набором кулеров. Если вы скачали прошивку именно со страницы материнки, то она скорее всего хочет видеть кулера на каждом из разъемов, а в вашей серверной платформе отсутствует какой-либо подключаемый кулер. Система думает, что кулер просто вышел из строя и пытается оставшимися нивелировать возможный перегрев. Эта ситуация у меня была именно на платформе Intel. Решение заключается в том, чтобы скачать обновление прошивки именно со страницы самой серверной платформы и обновить ещё раз.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Не обновлял прошивку.

показать ответы
0
Автор поста оценил этот комментарий

я не думаю что в серверных платформах пошли в сторону ноутбучной модели управления питанием, посему можно попробовать.
Надо только распиновку найти в инете, по модели БП.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

тут блоки с резервированием модуля, не провода, а что-то типа интерфейса видюхи для pci. Распаиваться на всём этом деле, для меня тоже самое, что выкинуть/заменить этот блок.

0
Автор поста оценил этот комментарий
Ага, но там сразу три компонента обновляются.
Вообще по кодам ошибок, посмотреть error лог в биосе.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

там нет, ничего не пишет, если я правильно понял где логи

0
Автор поста оценил этот комментарий
Интеловская мать. Шей. Там просто, файлы на флэшку, загрузка в шел, переход в флэшку, запуск обновления.
Конечно ещё может из-за подыхающей передней плате, где кнопка включения.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

"Шить" - имеете ввиду EFI обновить или откатиться ?
И если всё-таки вариант с передней платой, подскажите пожалуйста, как примерно понять в чём проблема ?

показать ответы
1
Автор поста оценил этот комментарий

Вот действительно, а точно полудохлого карлосона не завелось? Если один сдыхает, то все остальные очень часто идут на взлет, хотя и температура нормальная...

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
Допустим такую возможность, какие варианты диагностики есть, подскажите пожалуйста
показать ответы
2
Автор поста оценил этот комментарий

Лет 20 в сервера не лазил, но когда занимался, могли начать жужжать из за любой ошибки, начиная от севшей батарейки и заканчивая не совпадением версий bios и какой там шины. Ставилось оригинальное ПО, и мониторились ошибки.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Ну это здравый подход, но по мне, слишком радикально.

0
Автор поста оценил этот комментарий

Не лезу пока что обновлять, т.к. единственная железка. Прод некуда перекинуть, если что)

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Понял, это печально, у меня на нём несильно важный софт стоит, можно днём ковыряться.

2
Автор поста оценил этот комментарий

Тоже самое происходит, платформу не вспомню сейчас. В мониторинге esxi пишет, что один процессор отвалился, хотя все ок. Начинает жужжать в 5 вечера, все загрузки ок. Грешу на ipmi прошивку

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

а эта ситуация никак не разрешилась ?

показать ответы
1
Автор поста оценил этот комментарий

Жужит, значит работает, отстань от железки. Как перестанет, вот тогда ищи что сломалось.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

дак проблема в том, что он так раньше не жужжал(

0
DELETED
Автор поста оценил этот комментарий

пыль?термопаста?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

С этим всё гуд

0
Автор поста оценил этот комментарий

Если система решила, что ей жарко, значит ей жарко... Ищи причину перегрева... Ну а если ты уверен, что с температурой все нормально, можно добавить сопротивлении к кулеру...

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Подскажите пожалуйста, каким образом в данном EFI можно изменять сопротивление ?

показать ответы
0
DELETED
Автор поста оценил этот комментарий

пыль?термопаста?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

с пылью всё +- ок, пасту давненько не меняли, но я если честно, слабо верю эту проблему

показать ответы
4
Автор поста оценил этот комментарий

реально температуры мониторил? Может часть кулеров сдохла и у остальных обороты повышаются?

Переставить БП в другой слот не пробовал? Было недавно что в одном серваке отъехала плата распределения питания, в логах и ipmi было чисто, но сервак спонтанно вырубался. Причём мог на стресс-тесте отработать 6 часов, а по завершению через полчаса простоя вырубиться. У тебя смотрю БП прямо в мать втыкается и хрен знает как она там регулирует. Можно попробовать напряжения хотябы в молексах тестером замерить.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

ничего из вышеперечисленного не пробовал, проверю, попробую, спасибо!

показать ответы
3
Автор поста оценил этот комментарий

set fan profile

и altitude на 0 поставь

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

попробую, спасибо