Памятка Linux админу по основным утилитам диагностики
UPD: В комментариях @rickardo подкинул ссылочку на качество
UPD: В комментариях @rickardo подкинул ссылочку на качество
Я на работе так делаю, если выяснение причины занимает больше получаса. Стандартный образ со всем необходимым софтом развертывается за 40 минут, да и готовые машины всегда есть в запасе. Юзеру мешать работать выясняя проблему можно часами. И да, что бы исключить проблему с железом, я просто меняю системный блок, а проблемный уношу на диагностику.
На самом деле в большинстве случаев да, проще переустановить. Причём что винду, что линукс. Разбираться имеет смысл если речь идёт о сервере, да и то бывают исключения. Ну либо если проблема массовая. В остальных случаях за 20 минут перенакатить образ будет существенно быстрее, чем выяснять что именно сломалось.
На рабочих станциях далеко не всегда SSD, а скорость развёртки ограничивается, обычно, сетью и загруженностью сервера образов.
Ну в настоящее время стоимость новых HDD сопоставима со стоимостью SSD. Да, размеры будут различаться, но в корпоративном секторе это не критично. Все файлы должны лежать на файловом сервере а не на компах пользователей. Плюс надёжность SSD, как показывает практика, значительно выше
Харды расходный материал, поэтому перевести большую часть рабочих станций на SSD - вопрос пары лет.
Если упирается в сетку или загруженность сервера образов - значит либо они устарели, либо изначально были спроектированы неправильно.
Хотя я вполне понимаю, что у нас есть куча контор, которые в следствии скупости руководства или принадлежности к госсектору не имеют таких возможностей и приходится работать с тем, что есть.
> Все файлы должны лежать на файловом сервере а не на компах пользователей
Огонь горячий, а вода мокрая.
> Харды расходный материал, поэтому перевести большую часть рабочих станций на SSD - вопрос пары лет.
Если пользовательские машины стоят и работают, никто не будет их прото так менять.
> Если упирается в сетку или загруженность сервера образов - значит либо они устарели, либо изначально были спроектированы неправильно.
Ну нафига на пользовательских системах гигабит? Чисто ради того, чтобы время от времени образ переразворачивать на 10 минут быстрее? Тем, кому он необходим, он проведён.
SSD может вдохнуть вторую жизнь и в старое железо.
Ну а гигабит штатно в материнки встраивают уже лет 10.
Разница в ценнике между 1GB и 100MB сетками минимальна.
Вариантов развития сети при 1GB куча. Например перевод сотрудников на тонкие клиенты существенно снижают затраты.
Пользовательские машины имеют тенденцию ломаться. И именно харды вылетают практически чаще всего. Конкуренцию им составляют разве что БП.
> Разница в ценнике между 1GB и 100MB сетками минимальна.
Разница в стоимости коммутаторов примерно двухкратная. Хотя в целом соглашусь - современную сеть имеет смысл делать гигабитной.
> Вариантов развития сети при 1GB куча. Например перевод сотрудников на тонкие клиенты существенно снижают затраты.
Тонкие клиенты, требующие гигабитный поток? Это где такое чудо?
> Пользовательские машины имеют тенденцию ломаться. И именно харды вылетают практически чаще всего. Конкуренцию им составляют разве что БП.
Возможно, но они не настолько часто ломаются, чтобы проапгрейдить весь парк компьютеров в обозримые сроки.
> Тонкие клиенты, требующие гигабитный поток? Это где такое чудо?
Когда в начале рабочего дня пол сотни машин лезет грузить загрузочный образ, к примеру. Бездисковые рабочие станции поднимали?
> Разница в стоимости коммутаторов примерно двухкратная.
Бегло глянул на никсе. Идентичные устройства в гигабитном исполнении дороже примерно на треть, а не в половину.
Да и стоимость самого коммутатора не самый существенный пункт в смете локалки. Если это не локалка на 10-20 компов в маленьком офисе.
> Возможно, но они не настолько часто ломаются, чтобы проапгрейдить весь парк компьютеров в обозримые сроки.
Так главный вопрос начать. Нет, конечно найдутся самые стойкие машины, но если основной парк с пробегом 3-5 лет обновления хардов будет идти довольно бодро.
Минусующим: представьте что у вас рабочий день и довольно много задач - какой смысл тратить несколько часов на выяснение почему у пользователя глючит офис, если очевидно что это локальная проблема, а запустить reimaging занимает несколько минут и доступно техподдержке? То есть если дел нет, можно поковыряться, но обычно есть что-то более важное, чем можно заняться.
То же самое, например, с контроллером домена (если проблема не касается непосредственно AD) - смысл выяснять почему он не грузится, если можно его быстро и без последствий переставить? Сервера приложений, баз данных и т.п., обычно можно восстановить из бэкапа без потери данных.
Понятно, что это относится к ситуациям когда проблема связана с ОС/железом, а не с самим сервисом, но таких проблем хватает и тратить на них время нет смысла.
Для проф целей есть более удобный инструментарий. Например виртуализация всего и вся с репликацией виртуалок. Ёбнулся сервер? Поднялась реплика.
Ещё лучше кластер замутить....
Эммм... ни реплика, ни кластер не замена бэкапа. И если у вас навернулась виртуалка, реплика в принципе может помочь, но не всегда и сильно зависит от настроек репликации. А кластер в этом случае вам вообще не поможет.
(ЗЫ, чтобы не порождать недопонимание: я имею в виду "навернулась система внутри виртуалки", а не хост виртуализации или хранилище).
Есть. НО я и не утверждал, что это панацея. Просто один из вариантов оптимизации инфраструктуры.
linux как раз от винды тем и отличается что он просто так не ломается, для этого нужно либо что то изменить либо обновится. А если что то не хочет работать, то переустановка не поможет
> либо обновится
> просто так не ломается
Забавно
> для этого нужно либо что то изменить либо обновится
Внезапно, это и к винде относится.
Я не знаю что нужно делать с серверной виндой, чтобы всё это происходило. На практике, если не считать сбоев железа, случаев когда линукс при старте говорил "Ой, не могу смонтировать root" или по другим причинам уходил в невменяемое состояние, было как минимум не меньше, чем с таких проблем с виндой.
Вот, кстати, сходу не вспомню когда винда ломалась от этого (а серверов с виндой у нас довольно много), а вот у линукса любое обновление - это приключение, и иногда с фатальным исходом.
Из десктопного - свежий релиз десятки.
У серверной винды у меня однажды был случай. Но давненько было, и уже не вспомню, с каким конкретно обновлением это было связано. Благо, в тестовой группе было.
> Из десктопного - свежий релиз десятки.
Так не о десктопе же речь.
> У серверной винды у меня однажды был случай.
Я допускаю что могут возникнуть проблемы с обновлением, но именно как исключения.
А смысл в таком аптайме? У нас сервера для установки обновлений примерно раз в месяц перезагружаются.
А я за шо? А если не обновится и не перезагрузить, что будет?
Смысл в том, что услуга не прерывается. На конкретно этом сервере кнопку включения нажимали 3 раза с 13 года, винты меняли, а нагрузка там ого-го. А рядом стоит виндовый сервер, практически без нагрузки, его раз 5 за два года переустановил, и раз 100 перезагрузили.
> А если не обновится и не перезагрузить, что будет?
Да ничего, только какой в этом смысл? Ну стоял сервак с 2003 виндой, как выяснилось без перезагрузок больше года. И что это доказывает?
> Смысл в том, что услуга не прерывается.
И?
> А рядом стоит виндовый сервер, практически без нагрузки, его раз 5 за два года переустановил, и раз 100 перезагрузили.
Значит либо железо кривое, либо руки.
Ой, да ладно! Не ломается там, ага. Ну вот на вскидку с чем сталкивался, проблема с debian. После ребута просто отказался грузиться, выдав вот такой паник. И в чём тут дело?
Ага, знакомая история "Мы ничего не делали, оно само". root partition он у вас не видит. А почему, вспоминайте сами.
Это сервер, на котором крутился сайт. Перезапуск плановый, так что да, оно само. После очередного планового перезапуска сервер не поднялся.
Какая разница? Сбой электропитания, подвисший nginx, левая пятка начальника. Знаю только что оно работало до ребута, но было недоступно по rdp.
Сбой электропитания это плановая перезагрузка? Если у вас виснет nginx и вы лечите это плановой перезагрузкой, поздравляю, ваш админ вообще не отдупляет то чем занимается. А про левую пятку начальника вообще чушь.
Я вам расскажу как было на самом деле. Перезагрузку вы запланировали далеко не просто так, кто то натыкал своими кривыми рученками и перезагрузил, а оно не поднялось и теперь linux оказывается плохой, и я заодно с ним)))
Ты же говорил что плановый...
Сбой питания может привести в повреждению ФС и получаем панику.
Повисший Nginx как бы не причина для ребута. Да и на "работало до ребута" не тянет. Но если он повис из-за проблем с SD-картой, результат немного предсказуем.
Левая пятка начальника вообще зло.
Работал себе сервер, держал nginx, но по xrdp не доступен. Работает - не трогай, но у него есть плановая перезагрузка, после которой он не поднялся.
По итогу мы видим всё как обычно. Сервер который фиг знает как упал и никакими силами уже не поднимается и обвинения в криворукости. А линукс тут не причём.
Типичное линуксовое Ру комьюнити.
Ну вот опять... Он работал, но был недоступен. Ты уж определись, были ли проблемы до ребута.
По сути - у тебя малинка, которая прочитала ядро, но не может прочитать инит. Это или битая ФС, или умирающая карточка. Или ты правда ждал точный диагноз по фото?
GNU/Linux
1K постов15.5K подписчик
Правила сообщества
Все дистрибутивы хороши.
Будьте людьми.