Байки из серверной: обезьяний траблшутинг
В этом посте будет не одна история, а несколько забавных зарисовок, каждая из которых не достойна отдельного поста.
Обслуживал я как-то ЦОД одной федеральной службы в качестве инженера на аутсорсе. Я отвечал в первую очередь за системы хранения данных и резервного копирования, но и серверами занимался по мере необходимости. В ЦОДе у них был настоящий зоопарк из оборудования. Олни только хранилища были и Dell и NetApp и Emc. И вот однажды потребовалось извлечь из серверного шкафа один старенький сервер. А шкаф этот был прямо отдельным произведением искусства. Явно самый дешёвый шкаф из тонкого металла, который забили до отказа оборудованием. Судя по его виду, когда в него воткнули последний сервер, его намертво перекосило под тяжестью железа и ничего вытащить оттуда уже было нельзя. И вот я, как в сказке про репку, тяну-потяну а вытянуть не могу. Принимаю волевое решение вытащить часть серверов, не отключая их, так как они все очень важные, судя по рассказам ответственных лиц, чтобы разгрузить стойку и вытащить тот, который требуется. Стоит упомянуть что на все работы со мной ходил представитель организации, следил чтобы я чего лишнего не сделал. И вот, я выбрал первую жертву - сервер на два юнита со здоровенной ручкой, за которую его должно быть очень удобно вытаскивать. Берусь за эту ручку, тяну... и из корпуса сервера выезжает модуль с процессором и памятью. Оказывается, у этого сервера была очень, сука, удобная модульная архитектура. Чтобы получить доступ к процессору или памяти не нужно было вытаскивать весь сервер и раскручивать его. Нужно просто потянуть за ручку извлечения. Бросил быстрый взгляд на сопровождающего, увидел, что он не смотрит, быстро засунул модуль назад и притворился, что ничего не случилось)
Ещё интересные случаи были, когда я работал на второй линии поддержки пользователей из США и Канады.
У одного из клиентов было два контура сети. В одном контуре все серверы носили названия алкогольных напитков, а в другом - пород медведей. Видимо, это как-то связано с тем, что заказчик был из Канады. Проблема у него с нашим софтом была достаточно сложная и общался я с ним пару недель очень активно. В результате в контурах той компании появились серверы Samogon и Medved.
И мой любимый случай с той же работой. Когда заявка приходит на первую линию, сотрудники там отрабатывают по скриптам и, если не могут решить проблему, собирают все необходимые логи и передают кейс на вторую линию. И вот пришел ко мне такой кейс, где проблема явно сетевая, а логи wireshark, программы которая перехватывает сетевые пакеты, не собраны. Приходится мне писать клиенту письмо: дорогой клиент, для расследования проблемы нам нужны логи wireshark. Вы можете собрать из самостоятельно, вот инструкция, либо давайте назначим время, когда я смогу подключиться удаленно и собрать необходимые логи. Судя по всему наши индусы уже подзадолбали клиента, иначе я не могу объяснить то, что я получил в ответ. Его ответ я со смехом вспоминаю до сих пор: "у вас такая плохая техподдержка, что вы не могли бы оттраблшутить почему обезьяна с бананом в жопе не может срать". Очень хотелось написать в ответ что-то вроде: "мы конечно обезьянами не занимаемся, но в пробовали вытащить и снова вставить?" Но, мне бы это боком вышло, так что пришлось вежливо уговаривать на предоставление логов.