Ret666KM

Ret666KM

Подушним?
Пикабушник
поставил 2 плюса и 1 минус
570 рейтинг 30 подписчиков 6 подписок 4 поста 1 в горячем

Как я спасаю данные каждый день (или не спасаю): часть вторая

Wubba Lubba Dub-Dub, пикабушники, я вернулся из отпуска (но об этом отдельно).

Наконец закрылось окно бэкапа и теперь можем снова подушнить. В предыдущем своём посте я кратко рассказал о будничных пертурбациях инженера резервного копирования. В этой же части я расскажу о подходах нашей команды.

Как говорится: хорошая статья — залог успеха, заключённые согласятся, а мы поехали.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

Давным-давно это был самый обычный кабинет под номером 611. В нём мирно и активно работали сначала продажники, после них продакт-менеджеры и не знали они бед. Мир шатко держался в равновесии, пока однажды народ инженеров не развязал войну и не отнял эту территорию. Хотя по некоторым данным кабинет освободился в ковидные времена, ну да ладно, в нём всё равно никто не сидел в период "самоизоляции".

С тех самых пор как в него перебрался я, бывший инженер службы эксплуатации центров обработки данных (ЦОД) и нынешний инженер систем резервного копирования, кабинет превратился во всеми почитаемый «Душный уголок», который открыт избранным и закрыт… неизбранным ¯\_(ツ)_/¯.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

В нашем кабинете воистину собрались настоящие душнилы, но в то же время профессионалы своего дела. Я и коллеги совместными стараниями поддерживаем всю IT-инфраструктуру наших Заказчиков, будь то серверы, СХД, LAN/SAN, виртуализация, облачные сервисы, ОС, прикладные службы и СРК, само разумеется.

Так вот продолжим тему СРК. Со времён ещё когда-то тогдашнего ведения своей деятельности иностранных вендоров на территории РФ наша команда бэкаперов занималась поддержкой таких решений как Veritas NetBackup и Backup Exec, EMC NetWorker, CommVault и IBM TSM (последними двумя занималась только часть моих коллег, т.к. проектов по ним было не так много). В Veeam мы, конечно, тоже можем, но кейсов по ним на нас прилетало не так много.

Сейчас, после начала специального крестового похода, когда иностранные вендоры ушли, мы продолжаем пользоваться нашей богатой экспертизой и поддерживать эти продукты у тех, у кого они ещё остались, но также наш портфель пополнился свежими решениями: Кибер Бэкап, РуБэкап и парочка китайских Aishu AnyBackup и VinChin. Open source решения мы не поддерживаем, т.к. профита в такой поддержке нет. К тому же комьюнити само по себе хорошо справляется с настройкой и траблшутингом.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

Чем бэкапим мы разобрались. А вот на что — тут уже зоопарк поразношёрстнее. Тут всё работает по классике: "горячие" данные крутятся на SSD-стораджах, а вот "холодные" и "архивные" уже у нас на HDD и ленточных носителях. В самых редких случаях используются и VTL (Virtual Tape Library). Я уже понял, что вам интересно узнать обо всём чуточку подробнее, поэтому в дальнейшем планирую выпустить статьи по терминологиям и компонентам СРК. Пишите в комментариях о чём вам хотелось бы узнать.

В комментариях к прошлому посту упомянули про такое золотое правило как «3-2-1». Оно гласит следующее: храни не менее 3 копий — 2 на нескольких разных хранилищах и 1 на удалённом. Это самое короткое пояснение, но не самое подробное. На самом деле у нас есть своё правило, которое звучит так: «Храни копии так, чтобы ты всегда смог из них восстановиться».

Можно бесконечно много проектировать инфраструктуру так, чтобы у тебя был переизбыток, но это не всегда оправдано, т.к. бэкапы не ограничиваются 3 копиями. Обычно это длинные цепочки полных и промежуточных копий, которые хранятся месяцами и важно осознанно подходить к тому, что тебе нужно хранить, а что нет. И тебе обязательно нужно учитывать как оно хранится: в каком виде, как получить доступ к этим копиям, а как получить доступ, если доступа не будет. И это не правило резервного копирования — это серьёзная задача к построению отказоустойчивости и катастрофоустойчивости всей инфраструктуры.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

Вот здесь мы подходим к тому, что связность всегда должна быть при любой ситуации. Грамотный выбор сетевого оборудования, интерфейсов, компонентов и среды передачи данных позволяет распределять нагрузку на сеть, масштабировать её, защищать информацию и обеспечивать доступность даже в критических условиях. Это отдельная очень большая тема.

Сейчас важно лишь понимать, что в нашем случае есть несколько типов сетей: вычислительная сеть (LAN/WLAN), через которую проходит связь компонентов и взаимодействие протоколов, обеспечивающих мониторинг, управление, да в принципе любое привычное взаимодействие компьютеров, серверов и периферии; и сеть хранения данных (SAN), через которую осуществляется выделенная высокоскоростная передача данных между системами и устройствами хранения.

Сразу скажу, что резервные копии могут передаваться и так, и так. В идеале, резервное копирование эффективнее выполнять напрямую по SAN, т.к. даже при равной пропускной способности каналов она обеспечивает более надёжное и быстрое взаимодействие дисковых подсистем, не забивая при этом вычислительный канал связи. Но это не всегда возможно (например, с облачным хранилищем).  

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

В нашей работе мы придерживаемся традиционных планов РК (резервного копирования), в которых любое взаимодействие с данными продуктивных систем происходит в наименее загруженные часы. Как правило, это время с 20:00 до 08:00 в будние дни и выходные дни целиком, если это компания с базовым 5-дневным графиком. Однако для каждой компании могут быть свои исключения вплоть до определённой информационной системы.

Например, резервные копии некоторых чрезмерно больших кластеров баз данных выгоднее по производительности создавать с клона стэндбай ноды, который был создан на уровне СХД. Для чего? — Чтобы не создавать излишнюю нагрузку на стэндбай, т.к. это приведёт к задержке синхронизации активной ноды со стэндбай и это будет очень нехорошо для прикладной системы (кто угадает о какой СУБД идёт речь?). К счастью, такие ситуации бывают редки и во всех остальных случаях кластеры мы бэкапим просто с его стэндбай ноды.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

Ну и давайте затронем тогда уже тему того, как мы проверяем резервные копии. Конечно, такие проверки возможны лишь там, где это позволяет функционал выбранного ПО СРК, но как правило всё сводится к тому, что резервная копия проверяется на целостность с помощью контрольных сумм, восстановления где-нибудь в виртуальной песочнице, либо фактического штатного восстановления.

Копия прошла проверку? — Хорошо, однако это всё равно не гарантирует нам того, что в нужный момент мы сможем из неё восстановиться. Почему? — Потому что в нашей работе на всё нужно смотреть пессимистично. Чем больше ты найдёшь для себя причин «почему это сломается» — тем больше ты проработаешь моментов, которые увеличат шансы на успех. Поэтому мы всегда в первую очередь обращаем внимание не на то, сколько копий мы храним, а как мы это делаем.

Работать инженером СРК не только очень весело... но и не очень. СРК — это в принципе система, которая внедряется с надеждой на то, что ею никогда не придётся воспользоваться (или хотя бы не так часто). И это не потому, что она такая страшная — нет. Просто в первую очередь СРК служит прекрасным спасением при человеческом факторе и вмешательстве. Потеря данных систем по причине неполадок железа, как правило, должна пресекаться на уровне самого железа.

Как я спасаю данные каждый день (или не спасаю): часть вторая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Длиннопост, Карьера, Фотография, Мемы

Поэтому несмотря на все мемы — к бэкаперам обращаются чаще всего тогда, когда либо кто-то что-то нажал и всё пропало (в случае с плохим мануал-терапевтом мы тут вам не поможем), либо когда всё сломалось настолько, что спасут только бэкапы.

Увидимся в новых сериях!

Показать полностью 7

Как я спасаю данные каждый день (или не спасаю): часть первая

Привет, Пикабушники!

На фоне волны работ я, как и обещал в прошлом посте, хочу рассказать о своей.

Вообще, в народе нас кличут "бэкаперами" (не путать с "факаперами", нашими оппонентами), но я предпочитаю называться "инженером СРК". Правда когда начинаешь гуглить что такое СРК, то выползает "синдром раздражённого кишечника".

Как я спасаю данные каждый день (или не спасаю): часть первая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Видео, Длиннопост

Казалось бы при чём тут кишки и инженерия? Очень даже при чём.

На самом деле есть ещё одна расшифровка аббревиатуры СРК, которую я всячески стараюсь продвигать — Система резервного копирования.

Что это такое? В основном это программно-аппаратная связка, которая нужна, чтобы делать резервные копии данных (иными словами — бэкапы, но лично мы с коллегой зовём их мемно "бекасы") и складывать их не куда душе угодно, а в отдельное надёжное место.

Как я спасаю данные каждый день (или не спасаю): часть первая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Видео, Длиннопост

Зачем это нужно? Есть вот у вас очень ценные данные, терять которые не очень-то сильно хочется, а произойти такое может. И тут вдруг, как назло, диски накрылись, шифровальщик поигрался с файлами и теперь требует с вас биткоины или на компьютер, как обычно, упал метеорит — и всё, данных нет.

Так вот данных может уже и нет земля им текстолитом, но зато есть копии данных, которые надёжно хранятся не на тех же дисках, что были жестоко уничтожены, а на других. Надеюсь.

И из этих копий данных, которые обычно выглядят как сжатые или зашифрованные архивы невообразимых форматов, можно восстановить сами данные в первозданном виде с помощью СРК (будет ли раздражён ваш кишечник зависит, конечно, от случая, но тут я снова говорю про систему).

Как я спасаю данные каждый день (или не спасаю): часть первая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Видео, Длиннопост

Это мы рассмотрели только обыденный пользовательский случай, а теперь перенесёмся на корпоративный уровень. Вот здесь дела уже обстоят куда ещё веселее.

Если для обычного компьютера достаточно взять и подключить какой-нибудь внешний жёсткий диск, а потом складывать периодически на него бэкапы, то у компаний таких компьютеров могут быть миллиарды. Вдобавок появляются серверы, на которых крутятся сервисы, базы данных, почтовые службы, всё это может быть на разных операционных системах любых пород, мастей и происхождений, поэтому здесь нужно что-то посерьёзнее.

Как я спасаю данные каждый день (или не спасаю): часть первая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Видео, Длиннопост

Так что же в этой схеме делаю я? Этот вопрос я задаю себе каждый день Моя задача состоит в том, чтобы аудировать, проектировать, разворачивать, администрировать и поддерживать такие системы в разных компаниях, учитывая их сферу деятельности, размер, бюджет, особенности оборудования, сетевые коммуникации, используемые сервисы, объём данных, а также ещё много чего, включая климатические и сейсмогеологические условия, ретроградный Меркурий и фазы луны.

И взаимодействовать приходится со всем вышеперечисленным (ну почти), в том числе и с людьми.

На выходе получается рабочая инфраструктура из серверов с запущенными программами СРК, дисковых и/или ленточных хранилищ и кучи устройств, данные которых нам нужно сохранять.

Но какой ценой всё это...

История была бы слишком прекрасна — на деле же часто случается так, что исходная СРК компаний на ладан дышит, объёмы данных растут, всё постоянно перегружено и выходит из строя, а сервера каждую пятницу превращаются в леммингов, прыгающих со скалы под песню Короля и Шута (p.s.: самоубийства леммингов — это обман, чтобы набрать классы). И начинается: ты перепроектируешь систему, переписываешь регламенты, всё перенастраиваешь, а запросы на восстановления из бэкапов всё приходят и приходят.

В такие моменты главное не растеряться. Подошёл, взял за руку, уверенно сказал:

Как я спасаю данные каждый день (или не спасаю): часть первая Работа, Волна постов, IT, СРК, Технологии, Пикабу, Пикабушники, Юмор, Видео, Длиннопост

Вот в такой неравной борьбе машин и людей — мы, команда инженеров СРК, совместно с другими командами инженеров и айтишников, день ото дня стоим на страже ИТ и душним по поводу и без повода (и тут ни одно окно резервного копирования вам не поможет).

В следующей серии вы узнаете больше о наших рабочих моментах и локальных мемах. Оставляйте свои комментарии, если вам интересно узнать подробнее о СРК, и тогда я выпущу отдельный пост.

Подписывайтесь, ставьте лайки и классы.

До встречи! ;)

Показать полностью 4 1

О последних событиях

Пользуясь случаем, Глава ЧВК "Редан" вышел на связь и заявил о начале штурма ТЦ Авиапарк.

О последних событиях Юмор, Политика, ЧВК Редан, ЧВК Вагнера, Актуальное, Горячее, Волна постов, Fake News

Волна работ

Привет, Пикабу!
Хочу поделиться своей профессией. Я — инженер систем резервного копирования.

Волна работ Волна постов, Работа, Технологии, Фото с работы, Селфи, Мобильная фотография, Пикабушники, Пикабу, IT

А чем же так хороша и особенна моя работа вы узнаете в следующих постах! ;)

Отличная работа, все прочитано!