106

Начали зависать сервера с Windows Server - нашёл причину

Всех приветствую. Просто наблюдение от говноадмина говносерверов, по этому просьба знатокам сильно не пинать.


Есть несколько серверов с Windows Server 2019 - начали зависать в октябре с периодичностью от нескольких до 10-12 дней. Сервера на абсолютно разном железе, созданные и настроенные в разные годы. И даже по разным адресам. Года три сервера не обновлялись и изменений не вносилось.
Или синий экран без определённой ошибки и логов, или просто экран замораживается и не работает.

В Журналах Windows обнаружил множественную ошибку "Сбой промежного сохранения метаданных, результат=0x80070490 для контейнера "{.............}" ".
Ошибка с кодом 131 обычно. Началась как-раз где-то в октбяре.

131

131

Ошибка упоминается за разные годы и по разным причинам. Видимо тут какой-то косяк с работой с серверами Microsoft.

Соответственно, тут пригодился чужой совет с просторов интернета.

Идём в ветку реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Device Metadata
и проверяем ссылку в параметре DeviceMetadataServiceURL - она не рабочая. Это именно та ссылка, куда явно ломился сервер для "общения" с мелкомягкими.
Там же находим параметр PreventDeviceMetadataFromNetwork и устанавливаем ему значение "1", чтоб сервер перестал туда ломиться. Сервер для порядка перезагружаем, конечно же.

После этой манипуляции запросы пропадали и сервера виснуть переставали.

В интернете можно найти и другие варианты решения проблемы, но суть не в этом, а в самих наблюдениях, что именно из-за этой ошибки сервера и висли.
До этого проверял их на вирусы, проверял память, накопители, питание и т.п. - никаких результатов это не дало.

Плюс нигде не встречал упоминаний, что именно из-за этой ошибки могли виснуть сервера. Хотя были упоминания, что ошибка не вполне безобидна, т.к. всё-таки даёт лишнюю нагрузку на систему. Хотя никакой перегрузки по использованию процессора или памяти высмотреть не удалось. А вот какие-то программные сбои вызывать вполне могла.

Если у кого есть ещё полезные или правильные советы на тему - всегда пожалуйста. На линукс может быть и перешёл бы, да возможности в данных случаях нет.

Всю эту хню делаем на свой страх и риск, конечно же.

0
Автор поста оценил этот комментарий

Идём в ветку реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Device Metadata
и проверяем ссылку в параметре DeviceMetadataServiceURL - она не рабочая.

Так, ну проверили, ну нерабочая. Зачем мы ее искали? Чего с ней сделать-то надо?

раскрыть ветку (1)
4
Автор поста оценил этот комментарий

Поправил. Просто убедиться, что она действительно не рабочая.

показать ответы
0
Автор поста оценил этот комментарий

Ну вариантов Вы мне много накидали, спасибо большое! Я там ошибся, 2008 r2 конечно же. Переустанавливать вообще не вариант, Вы правы, и на свежую винсер не перейти - дорого будет восстанавливать и переустанавливать. С наступающим!

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Пожалуйста и с наступающим! Надеюсь всё решится.

1
Автор поста оценил этот комментарий

Блин, та же ситуация но с винсервер 2000 р2. Просто без объявления войны зависает и все. Ошибок не показывает. Можете посоветовать аналогичное решение?

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Честно говоря с 2000м никогда не работал, посмотреть есть ли в журнале ошибок такая же ошибка 131.
Проверить включено ли вообще логирование в Свойствах системы (вкладка Дополнительно, раздел Загрузка и восстановление), если там такое есть.


В журнале я просто начал смотреть все разделы журнала и выискивать где есть какие-то странные постоянно повторяющиеся ошибки. Т.к в целом в основных разделах были только сообщения, что система видимо неожиданно прекратила работу и перезапустилась....


Правда ещё вопрос на сколько старое само железо. Т.к. проблема может быть в памяти (по возможности вытаскивать по одной плашки и наблюдать, плюс как-то пробовать её диагностировать), в блоке питания (проверять программно и мультиметром напряжение на разных линиях, в т.ч. под нагрузкой) или попробовать заменить БП хотя бы временно.
Также проблема может быть в износе уже самой материнки, каких-то линий питания.
И жесткие диски проверить на ошибки.


Всё переустанавливать конечно можно, но да - вариант от ситуации так себе..


Например у меня был сервер 2012й, начал периодически зависать. И иногда при этом плохо включался. Оказалось, что у него какие-то цепи питания на материнке подгорели.


В общем всё очень индивидуально. Просто именно в моём случае зацепило то, что оно началось на разных серверах. Так что тут удачи могу пожелать найти то, с чем проблема.

показать ответы
1
Автор поста оценил этот комментарий

первое - читаем гугл и отучаем нах сервера бесконтрольно лазить в инете.. в нынешнее время не забываем ставить всусь..

https://www.veeble.com/kb/how-to-resolve-device-setup-manage... - ну шо за такое...

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

В наше время и обновляться-то страшно...