Как я спасаю данные каждый день (или не спасаю): часть вторая
Wubba Lubba Dub-Dub, пикабушники, я вернулся из отпуска (но об этом отдельно).
Наконец закрылось окно бэкапа и теперь можем снова подушнить. В предыдущем своём посте я кратко рассказал о будничных пертурбациях инженера резервного копирования. В этой же части я расскажу о подходах нашей команды.
Как говорится: хорошая статья — залог успеха, заключённые согласятся, а мы поехали.
Давным-давно это был самый обычный кабинет под номером 611. В нём мирно и активно работали сначала продажники, после них продакт-менеджеры и не знали они бед. Мир шатко держался в равновесии, пока однажды народ инженеров не развязал войну и не отнял эту территорию. Хотя по некоторым данным кабинет освободился в ковидные времена, ну да ладно, в нём всё равно никто не сидел в период "самоизоляции".
С тех самых пор как в него перебрался я, бывший инженер службы эксплуатации центров обработки данных (ЦОД) и нынешний инженер систем резервного копирования, кабинет превратился во всеми почитаемый «Душный уголок», который открыт избранным и закрыт… неизбранным ¯\_(ツ)_/¯.
В нашем кабинете воистину собрались настоящие душнилы, но в то же время профессионалы своего дела. Я и коллеги совместными стараниями поддерживаем всю IT-инфраструктуру наших Заказчиков, будь то серверы, СХД, LAN/SAN, виртуализация, облачные сервисы, ОС, прикладные службы и СРК, само разумеется.
Так вот продолжим тему СРК. Со времён ещё когда-то тогдашнего ведения своей деятельности иностранных вендоров на территории РФ наша команда бэкаперов занималась поддержкой таких решений как Veritas NetBackup и Backup Exec, EMC NetWorker, CommVault и IBM TSM (последними двумя занималась только часть моих коллег, т.к. проектов по ним было не так много). В Veeam мы, конечно, тоже можем, но кейсов по ним на нас прилетало не так много.
Сейчас, после начала специального крестового похода, когда иностранные вендоры ушли, мы продолжаем пользоваться нашей богатой экспертизой и поддерживать эти продукты у тех, у кого они ещё остались, но также наш портфель пополнился свежими решениями: Кибер Бэкап, РуБэкап и парочка китайских Aishu AnyBackup и VinChin. Open source решения мы не поддерживаем, т.к. профита в такой поддержке нет. К тому же комьюнити само по себе хорошо справляется с настройкой и траблшутингом.
Чем бэкапим мы разобрались. А вот на что — тут уже зоопарк поразношёрстнее. Тут всё работает по классике: "горячие" данные крутятся на SSD-стораджах, а вот "холодные" и "архивные" уже у нас на HDD и ленточных носителях. В самых редких случаях используются и VTL (Virtual Tape Library). Я уже понял, что вам интересно узнать обо всём чуточку подробнее, поэтому в дальнейшем планирую выпустить статьи по терминологиям и компонентам СРК. Пишите в комментариях о чём вам хотелось бы узнать.
В комментариях к прошлому посту упомянули про такое золотое правило как «3-2-1». Оно гласит следующее: храни не менее 3 копий — 2 на нескольких разных хранилищах и 1 на удалённом. Это самое короткое пояснение, но не самое подробное. На самом деле у нас есть своё правило, которое звучит так: «Храни копии так, чтобы ты всегда смог из них восстановиться».
Можно бесконечно много проектировать инфраструктуру так, чтобы у тебя был переизбыток, но это не всегда оправдано, т.к. бэкапы не ограничиваются 3 копиями. Обычно это длинные цепочки полных и промежуточных копий, которые хранятся месяцами и важно осознанно подходить к тому, что тебе нужно хранить, а что нет. И тебе обязательно нужно учитывать как оно хранится: в каком виде, как получить доступ к этим копиям, а как получить доступ, если доступа не будет. И это не правило резервного копирования — это серьёзная задача к построению отказоустойчивости и катастрофоустойчивости всей инфраструктуры.
Вот здесь мы подходим к тому, что связность всегда должна быть при любой ситуации. Грамотный выбор сетевого оборудования, интерфейсов, компонентов и среды передачи данных позволяет распределять нагрузку на сеть, масштабировать её, защищать информацию и обеспечивать доступность даже в критических условиях. Это отдельная очень большая тема.
Сейчас важно лишь понимать, что в нашем случае есть несколько типов сетей: вычислительная сеть (LAN/WLAN), через которую проходит связь компонентов и взаимодействие протоколов, обеспечивающих мониторинг, управление, да в принципе любое привычное взаимодействие компьютеров, серверов и периферии; и сеть хранения данных (SAN), через которую осуществляется выделенная высокоскоростная передача данных между системами и устройствами хранения.
Сразу скажу, что резервные копии могут передаваться и так, и так. В идеале, резервное копирование эффективнее выполнять напрямую по SAN, т.к. даже при равной пропускной способности каналов она обеспечивает более надёжное и быстрое взаимодействие дисковых подсистем, не забивая при этом вычислительный канал связи. Но это не всегда возможно (например, с облачным хранилищем).
В нашей работе мы придерживаемся традиционных планов РК (резервного копирования), в которых любое взаимодействие с данными продуктивных систем происходит в наименее загруженные часы. Как правило, это время с 20:00 до 08:00 в будние дни и выходные дни целиком, если это компания с базовым 5-дневным графиком. Однако для каждой компании могут быть свои исключения вплоть до определённой информационной системы.
Например, резервные копии некоторых чрезмерно больших кластеров баз данных выгоднее по производительности создавать с клона стэндбай ноды, который был создан на уровне СХД. Для чего? — Чтобы не создавать излишнюю нагрузку на стэндбай, т.к. это приведёт к задержке синхронизации активной ноды со стэндбай и это будет очень нехорошо для прикладной системы (кто угадает о какой СУБД идёт речь?). К счастью, такие ситуации бывают редки и во всех остальных случаях кластеры мы бэкапим просто с его стэндбай ноды.
Ну и давайте затронем тогда уже тему того, как мы проверяем резервные копии. Конечно, такие проверки возможны лишь там, где это позволяет функционал выбранного ПО СРК, но как правило всё сводится к тому, что резервная копия проверяется на целостность с помощью контрольных сумм, восстановления где-нибудь в виртуальной песочнице, либо фактического штатного восстановления.
Копия прошла проверку? — Хорошо, однако это всё равно не гарантирует нам того, что в нужный момент мы сможем из неё восстановиться. Почему? — Потому что в нашей работе на всё нужно смотреть пессимистично. Чем больше ты найдёшь для себя причин «почему это сломается» — тем больше ты проработаешь моментов, которые увеличат шансы на успех. Поэтому мы всегда в первую очередь обращаем внимание не на то, сколько копий мы храним, а как мы это делаем.
Работать инженером СРК не только очень весело... но и не очень. СРК — это в принципе система, которая внедряется с надеждой на то, что ею никогда не придётся воспользоваться (или хотя бы не так часто). И это не потому, что она такая страшная — нет. Просто в первую очередь СРК служит прекрасным спасением при человеческом факторе и вмешательстве. Потеря данных систем по причине неполадок железа, как правило, должна пресекаться на уровне самого железа.
Поэтому несмотря на все мемы — к бэкаперам обращаются чаще всего тогда, когда либо кто-то что-то нажал и всё пропало (в случае с плохим мануал-терапевтом мы тут вам не поможем), либо когда всё сломалось настолько, что спасут только бэкапы.
Увидимся в новых сериях!
Опыт с нейронками и попытка в пост, который будет полезным
Последнее время хочется две вещи:
Писать о том, в чем нравится разбираться. Может кому-то будет полезно.
Найти коммьюнити, чтобы разбираться в чем-то было интереснее с одной стороны, а с другой – можно было бы расширить поле для тестирования.
К делу. Я работаю преподавателем, экспертом в области высшего образования, социологом, помимо этого, веду образовательные проекты, и моя работа состоит из нескольких составляющих: я креативлю, организую, придумываю, соединяю людей, учу студентов, подтягиваю их к своим инициативам или инициативам команды, и в целом, мне все нравится!
Полгода назад, когда языковые нейронки начали очень бурно развиваться (ChatGPT), я решил потестировать эту историю и был очень приятно удивлен. Использование языковых нейронок, таких как ChatGPT, GPT-4, Claude, а также такие сервисы, как Raycast Copilot для macOS или Perplexity.AI, это совершенно новое понимание продуктивности, эффективности и работы с информацией. Если вы смотрели фильм "Области тьмы", где главный герой кушал таблеточки и становился ну просто невероятным, то вот у меня примерно такие же ощущения.
Могу говорить долго про этику, юридический аспект или про то, что роботы нас всех победят и уволят, однако, факт есть факт. На данный момент мы можем наблюдать вполне себе явную тенденцию: человеко-машинный комплекс (смотри человек + chatGPT) гораздо более эффективный сотрудник, чем просто человек. Почему? Да просто потому, что человек, который использует нейронки в повседневности, быстрее и эффективнее, способен гораздо быстрее генерировать контент, идеи, ему не нужны дополнительные созвоны для уточнений, фокус-группы для проверки гипотез или другая точка зрения, так как обо всем этом можно попросить чатик, открытый в любом интернет-браузере на любом устройстве в любое время.
Далее я расскажу о нескольких сервисах, которые я использую ежедневно в своей работе, и опишу сценарии взаимодействия с ними. Все они так или иначе связаны с языковой моделью GPT-4.
ChatGPT — на данный момент, наверное, самый распиаренный сервис, потому что про него пишут СМИ и технологические форумы каждый день. Недавно сказали, что ChatGPT отупел, но это совсем не так. Если оплатить подписку, то горизонты использования данного чатбота начинают ограничиваться лишь вашей фантазией. Можно работать с файлами любых форматов, работать с интернет-источниками, при использовании плагинов, обрабатывать таблицы, проводить операции с данными. С помощью чатбота можно планировать день, писать креативные концепции проектов, управлять, автоматизировать, управлять финансами. Данный сервис я использую практически во всех своих проектах и публичных выступлениях.
Perplexity.ai — просто находка, которая использует интернет в каждом запросе. Причем ее можно настроить как на интересующие вас источники, так и расширить каждый запрос с помощью ютуба, реддита или академических источников, что для людей науки просто какая-то находка. При активации подписки вы получаете модель GPT-4, а также функцию Copilot, которая будет уточнять промпты или задавать конкретные наводящие вопросы, при этом проверяя весь контент, который она за вас производит в интернете.
Raycast — софтинка, которая позволяет с помощью хоткеев делать и запускать что угодно буквально из одной строки. В последних обновлениях интегрировали ИИ в качестве полноценной интеграции в систему, которую настраиваете сами. Сценарии, которые использую каждый день: перевод академических текстов с английского на русский, автоматические ответы на письма, автоматическая проверка орфографии, пунктуации и стиля, и все это подвязано на горячие клавиши.
Здесь описаны сервисы, которые я использую каждый день по несколько часов.
Недавно на реальных кейсах проверял, насколько все эти инструменты могут быть полезны в продакт-менеджменте: составление опросов, гайдов интервью, расчеты по формулам, unit-экономические кейсы, построение roadmap, работа с CJM, производство гипотез и способов их проверки. Со всем этим сервисы справляются просто отлично, если правильно писать промпты (про это я также отдельно напишу пост).
Про цены на подписки не писал сознательно, но рассчитывайте на то, что каждый сервис стоит около 2000 рублей в месяц и принимает к оплате только иностранные карты. Как такую сделать быстро, просто и дешево — напишу отдельный гайд.
Также для использования ChatGPT требуется хороший VPN-сервис/протокол. Если получится сделать коммьюнити полноценное, то подключу всех желающих.
P.S. Грамотность данного поста проверена с помощью нейросети.
P.S.S. Пишите комменты, подкидывайте гипотезы для проверки, буду смотреть и делиться опытом!
Мифы о работе в крупных международных IT компаниях
Для многих программистов, и не только, работа в крупной международной компании кажется чем-то особенным, пиком карьеры. Но это совсем не так. Я работаю программистом в Amazon уже 2 года, и не все так безоблачно, как выглядит со стороны. Итак, к мифам:
1. Можно сидеть и спокойно получать зарплату.
До 2023 это действительно было так. Но в этом году все кардинально изменилось. Новости о массовых увольнениях в Google, Facebook, Amazon и тд. легко гуглятся. Беспрецедентный случай, который убил мою веру в компанию, когда руководство Google уволило тысячи людей по электронной почте.
2. Баланс работы и жизни
Многое зависит от команды и страны нахождения. В США сотрудники получают огромные зарплаты, но жертвуют этим балансом. У сотрудников нет "официальных" больничных и им не платят за переработки. Только 14 дней оплачиваемого отпуска и все. Заболел — бери или просто отпуск, или отпуск за свой счет. В Испании, где я сейчас живу, все намного лучше с этим. За переработки реально обязаны платить, а официальных отпускных дней - 25 в год.
3. Все работают с передовыми технологиями над крутыми проектами
Действительно, в Facebook, Amazon, Apple, Netflix и Google (FAANG) есть крутые и супер сложные проекты. Но это совсем не означает, что именно ты будешь в одной из таких команд. Скорее всего, все будет совсем наоборот. Этим компаниям уже не один год, и накопилось много старых решений, которые надо поддерживать. А кто их поддерживает? Правильно, те кто хотел бы работать над чем-то крутым. Угадайте на какой стороне я?
В Саратове разработали тестирование на профпригодность
💼Ученые и студенты СГТУ разработали систему оценки профессиональных навыков. Программа поможет автоматизировать процесс оценки и подбора сотрудников. Сегодня цифровые компетенции становятся особенно важными, и проект «Профессионалитет» создан для обучения молодежи навыкам, требующимся на рынке труда. Благодаря проекту уже создан 141 центр, объединяющий колледжи и предприятия, чтобы студенты получали практическую подготовку и были готовыми к работе на современном производстве.
Если вы профи в своем деле — покажите!
Такую задачу поставил Little.Bit пикабушникам. И на его призыв откликнулись PILOTMISHA, MorGott и Lei Radna. Поэтому теперь вы знаете, как сделать игру, скрафтить косплей, написать историю и посадить самолет. А если еще не знаете, то смотрите и учитесь.