Серия «Усталый босс»

0

Agile без ритуалов — эволюция после бюрократии

Generated by Nano Banana

Generated by Nano Banana

Agile ругают за пустые ритуалы, водопад — за медлительность. Но спор чаще идёт о форме, нежели о сути. Когда-то бюрократия — в духе Макса Вебера и его рационально-легальной модели — научила организации масштабироваться: стандарты, роли, предсказуемость. Цена этой масштабируемости — тяжёлый пересмотр решений и медленный разворот. Agile — следующий шаг эволюции: он учит быстро учиться в процессе поставки, а не только планировать. Смысл — в коротких циклах, где каждая итерация заканчивается работающим инкрементом и проверкой гипотез на реальности.

Противоречия между Agile и Waterfall нет. Можно рассматривать Waterfall как одну из конфигураций Agile, когда из-за требований/рисков команда выбирает очень длинный спринт с единым выпуском в конце.

Почему Agile часто не принимают

Generated by Nano Banana

Generated by Nano Banana

1) Инертность «старого менеджмента»

Люди, воспитанные в логике годовых планов и phase-gates-модели, оптимизируют предсказуемость и контроль. Их KPI — «по плану и в срок», зачастую игнорируя выученные уроки. Итерации для них выглядят как «незавершёнка», а видимые переработки — как провал, хотя это нормальная цена за ранние факты.

Плюс срабатывает выученная модель: «сначала всё решает начальник, потом команда просто реализует». Agile переворачивает это местами: команде приходится чаще принимать решения, а менеджеру — мириться с тем, что путь меняется по дороге.

2) Нежелание разбираться в сути и областях применимости

Agile подменяют ритуалами и пытаются применять «везде одинаково».

  • Итерации тащат в зоны необратимых решений (критичные данные, публичные контракты, безопасность) — получаются дорогие ошибки, после чего делают вывод «Agile не работает».

  • Или, наоборот, объявляют «гибкость» синонимом хаоса: без Definition of Done, наблюдаемости, критериев «достаточно» и guardrails. Тогда Agile превращается в оправдание «делать что хотим».

В обоих случаях это не Agile по смыслу, а просто плохо настроенный процесс с другим названием.

3) Конфликт с системой мотивации и корпоративным планированием

Топ-менеджмент пишет годовые планы с KPI, спускает их на линейных менеджеров и одновременно требует «работать по Agile». На бумаге — спринты и бэклог, в реальности — жёстко зафиксированный объём, сроки и метрики запуска «как в плане».

В таких условиях Agile на линейном уровне превращается в пародию:

  • команда должна делать вид, что «гибко адаптируется»,

  • но её оценивают по тому, насколько она не отклоняется от изначального годового плана.

Любая попытка честно скорректировать курс по результатам итерации воспринимается как «неисполнение плана», а не как нормальное обучение. Естественно, после такого у людей возникает стойкое отвращение к слову Agile.

Неприятие нового: уроки MBO

Generated by Nano Banana

Generated by Nano Banana

Само по себе неприятие Agile — не что-то уникальное. Почти любое серьёзное управленческое новшество проходит долгий цикл — десятилетиями — через фазы: страх → неприятие → торг → принятие → базовая норма. Хороший пример — **Management by Objectives (MBO) Питера Друкера: когда-то идея управлять через согласованные цели, а не только через приказы сверху, пугала и казалась «теорией консультантов»; компании проходили через торг — цели формально ввели, но часто просто переписывали их из планов руководства. Сегодня MBO и его наследники (KPI, OKR) стали фоном: почти никто не спорит, что у команды должны быть понятные цели, спорят уже о том, как именно их формулировать. С Agile происходит тот же процесс, только объект изменений другой: не сами цели, а способ движения к ним — длинными монолитными циклами или короткими витками обучения.

Другие знакомые сюжеты

Точно такой же паттерн можно увидеть и в более близких примерах:

  • Удалённая работа и онлайн-обучение.

Ещё недавно идея «команда работает из дома» или «учиться можно онлайн» воспринималась как временная мера или вынужденный компромисс. Сейчас онлайн-форматы стали частью нормы, хотя до сих пор есть те, кто не принимает это как состоявшийся факт.

  • Гигиена и мытьё рук медперсоналом.

Когда-то требование мыть руки между пациентами вызывало яростное сопротивление и воспринималось как сомнение в профессионализме врача. Сегодня отказ от гигиены — маргинальное поведение, а не «альтернативный подход».

Во всех этих историях новое сначала кажется опасным, лишним или «модой», затем идёт долгий период торга и полумер, и только потом наступает стадия, когда вчерашняя инновация превращается в baseline — фон, с которого начинается следующий виток изменений.

С Agile, скорее всего, будет то же самое: через какое-то время спорить будут не о том, «нужен ли Agile в принципе», а о том, как именно конфигурировать процессы и архитектуру работы под конкретную организацию, считая итерационную работу и обучение на поставке чем-то само собой разумеющимся.

Зачем вообще Agile, если Waterfall и бюрократия не умерли

Generated by Nano Banana

Generated by Nano Banana

Если отбросить лозунги, Agile нужен не для того, чтобы «всем было весело на стендапах». Он про другое: как дешевле учиться на реальности, когда окружение меняется быстрее наших планов.

Бюрократия и классический проектный подход решают задачу предсказуемости: чтобы люди знали свои роли, процессы повторялись, а результат можно было встроить в годовой план. В мире, где изменения редкие и медленные, этого достаточно.

Проблема начинается там, где:

  • требования двигаются вместе с рынком и технологиями,

  • цена задержки становится выше, чем цена возможных переделок, а «идеальное ТЗ» устаревает быстрее, чем его успевают согласовать.

    Agile в такой среде меняет точку оптимизации:

  • вместо «минимизировать переделки» — минимизировать задержку обучения на ошибках,

  • вместо «сделать один большой правильный выстрел» — провести короткую разведку боем,

  • вместо «дотянуть любой ценой до финального релиза» — иметь право остановиться раньше, когда ценности уже достаточно или направление оказалось тупиковым.

Отсюда и вся остальная механика: инкременты, экспериментальность, короткие циклы. Не потому что так написано в книжке по Scrum, а потому что это дешёвый способ регулярно задавать себе два простых вопроса:

*«Мы всё ещё делаем то, что нужно?» и «Не пора ли остановиться или повернуть?»

А как же оптимизация? В такой формулировке Agile действительно не выглядит «идеально вылизанным»: лишние инкременты, разведка боем, работа над ошибками. Возможно, в моменте так и есть — по локальным затратам классический водопад иногда выглядит выгоднее. Но всё поддаётся сравнению на длинной дистанции. Гипотетически проект можно провести по Waterfall достаточно быстро, возможно даже быстрее, чем по Agile… вопрос только в том, принесёт ли он пользу в той реальности, в которую придёт через год. Как говорится, большое видится на расстоянии* на коротком отрезке мы экономим на «лишних» итерациях, на длинном — часто расплачиваемся за это годами поддержки не того решения.

От идеи до GA: знакомый Agile, который мы не всегда замечаем

Generated by Nano Banana

Generated by Nano Banana

Если оглянуться назад на классический путь фичи или инициативы — Idea → Prototype → PoC → MVP → Pilot → GA — становится видно, что это по сути тоже конфигурация Agile.

Во-первых, каждый этап даёт **ощутимый инкремент**, пусть и не всегда в продакшене.

  • 💡Идея оформлена и проговорена — уже инкремент по сравнению с неоформленным хаосом.

  • 🧠 Прототип позволяет «пощупать» UX.

  • ⚙️ PPoC проверяет техническую реализуемость.

  • 👥 MVP — это уже рабочий продукт для ограниченной аудитории.

  • 💼 Пилот даёт реальный опыт эксплуатации.

Каждый из этих шагов можно показать, обсудить, на нём можно учиться.

Во-вторых, такой workflow даёт возможность «съехать» на любой стадии с минимальными потерями. Если что-то не взлетает на уровне прототипа или PoC, мы теряем существенно меньше, чем если бы сразу шли к большому релизу. Это и есть та самая управляемая гибкость: мы не обязаны бежать до GA любой ценой, у нас есть несколько точек выхода по дороге.

Более того, в Agile совершенно нормально начать с одной идеи, а реализовать в итоге другую — и это не провал, а признак здорового процесса обучения. Об этом я расскажу в следующей статье.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 4
2

От PoC к масштабу — как превратить пилот в повседневную реальность

📖 Введение

Generated by Copilot

Generated by Copilot

Когда речь идет о серьезной инициативе, командам нужен общий язык и предсказуемая, и известная последовательность шагов.

Главный риск в крупных инициативах — не технологии, а координация людей и ожиданий. Поэтому разумнее сначала подтвердить ценность на ограничённой зоне и лишь потом масштабироваться: короткие волны, явные критерии выхода и решения go/no-go на каждом этапе. Такая этапная модель снимает организационный шум и позволяет безопасно двигаться к целевому состоянию без попытки сразу строить «идеал».

Эта статья — про стадии реализации крупной инициативы: как перейти от замысла к широкому запуску с минимальными рисками и оптимизированными усилиями.

📝 Коротко о различиях в этапах

  • 💡 Idea — формулировка проблемы и "гипотезы ценности".

  • 🧠 Prototype — быстрый способ показать как это будет выглядеть/работать (макет, кликабельная демка, «волшебник из страны Оз»; быстрая сборка из подручных средств).

  • ⚙️ PoC (Proof of Concept) — техническая проверка реализуемости в приближённых к реальности условиях.

  • 👥 MVP (Minimum Viable Product) — минимальный продукт для проверки "ядра ценности" на реальных пользователях.

  • 💼 Pilot — частичное внедрение в production; доказательство, что решение может и будет жить в эксплуатации; финальный approval перед масштабированием.

  • 🌍 GA (General Availability) — довнедрение и доступность для всей целевой аудитории.

    Сводную таблицу по всем этапам смотрите в Приложении в конце статьи.

🔍 Пример на этапах: миграция баз данных с on-prem в облако (повествовательно)

💡 Idea

Generated by Copilot

Generated by Copilot

Реализация крупной инициативы начинается с "Идеи".

Наша идея проста и амбициозна: перенести около ста баз данных — вперемешку prod и non-prod — в облако.

Важно не «как», а «зачем» — и стоит ли игра свеч? Анализируем возможности, плюсы и минусы, считаем TCO, проводим встречи со стейкхолдерами (бизнес, безопасность, эксплуатация, финансы). Здесь же можно остановиться, если «игра не стоит свеч» — самое время закончить проект без убытков 🙂.

🧠 Prototype

Generated by Copilot

Generated by Copilot

Дальше нужна «картинка будущего», чтобы все говорили об одном и том же. И чтобы инициатива не зашла в ситуацию, когда кажется, что обсуждаем одно и то же, а на деле каждый понимает своё, — как можно быстрее переходим в практическую плоскость. Нужен рабочий стенд — это и есть прототип.

Поднимаем экземпляр базы данных (или несколько) в облаке. Загружаем анонимизированные данные. Например, можно собрать отдельную БД с аудит-логами разных систем на сотни гигабайт, предварительно их анонимизировав.

Теперь у нас есть рабочее черновое решение. На его основе можно строить реальные демо и убеждать стейкхолдеров эффективнее. Кроме того, на следующих стадиях мы сможем оттачивать гипотезы уже на реальном продукте, пусть ещё в форме набросков.

⚙️ PoC (Proof of Concept)

Generated by Copilot

Generated by Copilot

Теперь — практика. Цель PoC — доказать, что инициатива будет работать. Делаем внедрение, максимально приближённое к реальности.

Если в прототипе мы прежде всего убеждали СЕБЯ 🧑, что всё ВООБЩЕ 🤔может работать, то теперь настало время убедить БИЗНЕС 💼 И речь не только о работоспособности целевого решения, но и о самом методе движения к нему: последовательности шагов, повторяемости процедуры, понятных входах/выходах и критериях качества.

Берём non-prod базу (с данными, максимально приближёнными к prod) и клонируем её в облако. Прогоняем процесс миграции, фиксируем шаги, пишем первичную документацию, проводим замеры. Приглашаем реальных пользователей и владельцев приложений потестировать. Master-копия остаётся on-prem.

Результат: у нас есть продукт (или его часть), который работает и потенциально приносит value — это подтверждают замеры. Есть повод вынести на очередной approve (go/no-go).

👥 MVP (Minimum Viable Product)

Generated by Copilot

Generated by Copilot

Первая настоящая эксплуатация — но в управляемом контуре. Цель MVP — доказать, что продукт может эксплуатироваться. Конечные реальные пользователи пробуют продукт и дают обратную связь. Они — главные тестировщики, а не специалисты поддержки и разработчики. Продукт может не иметь всех заявленных фич, но core-фичи на месте. Если до этой стадии мы тянули с трудом сани в гору, то после MVP уже катимся с ветерком с горы. Остальные стадии (Pilot, GA) с точки зрения приёмки уже выглядят как sanity-checks.

Два практичных сценария для переноса баз данных в облако (в идеале оба):

1) Частичный перенос в облако значимых для бизнеса БД, но ещё non-prod — например, UAT-серверы (User Acceptance Testing) с серьёзной нагрузкой.

2) Частично переносим некритичный prod.

Перенесённое в рамках MVP — с вероятностью ~99% остаётся в облаке.

Если мы всё делали как надо, объём проекта (scope) уменьшается: то, что уже переехало в рамках MVP, повторно переносить не придётся.

Что получаем?

  • Подтверждённая жизнеспособность решения в эксплуатации.

  • Переключение/откат проверены и описаны.

  • Есть опорный контур для масштабирования.

  • Документация и рутины (чек-листы, runbook, окна) в рабочем состоянии.

  • Сопротивление стейкхолдеров должно значительно упасть.

💼 Pilot

Generated by Copilot

Generated by Copilot

К началу Pilot, как правило, уже понятно, что проекту «быть»: утверждён бюджет, подписаны контракты с поставщиками, согласованы сроки и объём. Теперь задача — организовать плавное и максимально безопасное «приземление» План по дням/неделям/месяцам есть — осталось начать. Чтобы снизить риск, выбираем лояльных заказчиков и приложения, сбой которых не остановит бизнес, но эффект будет заметен; одновременно в пилоте проверяем и подтверждаем бизнес-ценность (метрики результата, экономия/затраты, отклик пользователей, готовность владельцев процессов).

Pilot — это работа с реальными пользователями и PROD-нагрузками. Здесь в последний раз оттачиваем процессы и доводим документацию.

Например, выбираем две базы: одну с OLTP-нагрузкой и одну с DWH. Они не критичны, но и не самые лёгкие — влияние видно. Переносим их в облако и делаем все нужные измерения.

Что получаем?

  • Работает у реальных пользователей без сюрпризов.

  • Переключение/откат отрепетированы, шаги и ответственные понятны.

  • Мониторинг даёт нужные сигналы без лишнего шума.

  • Инструкции и чек-листы готовы, контакты дежурных назначены.

  • Интеграции проверены; скрытые зависимости сняты или в плане.

  • Затраты подтверждены реальными счетами.

  • Есть чемпионы-пользователи и референсы.

  • Короткий список что доделать до GA с приоритетами.

🌍 GA (General Availability)

Generated by Copilot

Generated by Copilot

Финальный поворот — не эффектный «большой релиз», а аккуратная дораскатка и переход к обычной жизни. Планируем волны, заранее коммуницируем freeze-периоды, делаем cutover по чек-листам, усиливаем дежурства и связь с бизнесом. Путь отката должен быть реальным*а не «на бумаге» — проверен на репетициях. Параллельно доводим наблюдаемость и эксплуатацию до стандартов: дашборды, алерты, runbook’и, регламенты эскалации, расписания on-call.

Через какое-то время, когда новый ритм стабилизируется, аккуратно выводим из эксплуатации старые ресурсы — чтобы не платить дважды и убрать путаницу в контурах.

Что получаем?

  • Продукт доступен всей целевой аудитории и стабильно работает.

  • Эксплуатация ведётся по устойчивым процедурам (мониторинг, алерты, on-call, регламенты).

  • Предсказуемые затраты*и прозрачный биллинг; legacy выключен.

  • Метрики стабильности/производительности/стоимости под контролем, риски локализованы.

📌Заключение

В больших инициативах хаос возникает не из-за нехватки умных людей, а из-за отсутствия общего языка и последовательности. Шесть этапов — это простой контракт ожиданий между бизнесом, инженерами, безопасностью и эксплуатацией. Каждый шаг «сжигает» конкретный класс рисков:

💡 Idea — риск «делаем ли мы то, что нужно»; 💡 Prototype — риск непонимания решения; ⚙️ PoC — риск технической реализуемости; 👥 MVP — риск жизнеспособности в реальной среде; 💼 Pilot— риск эксплуатационной готовности; 🌍 GA — риск операционной устойчивости и масштабирования.

Почему нельзя «перепрыгнуть»? Потому что ускорение без снятия рисков — это долг с высокой ставкой. Типичные антипаттерны:

  • ⚙️ Вечный PoC: нет мостика к эксплуатации и критериям выхода.

  • 👥 MVP как конечная остановка: «временное» становится постоянным без наблюдаемости и отката.

  • 💼 Пилот без exit-критериев: бесконечная бета, в которой всё «почти готово».

  • 🌍 GA без плана вывода legacy: двойная оплата и путаница в контурах.

Не бойтесь останавливаться: если данные на любом этапе говорят «нет», это тоже результат. Вы экономите бюджет, сокращаете риск и оставляете после себя полезные наработки — документацию, скрипты, метрики, выводы.

И наконец, этот каркас работает не только для миграций: платформенные изменения, интеграции, запуск новых сервисов, крупные рефакторинги — везде, где много участников и высока цена ошибки. Сила подхода в том, что он делает сложное управляемым и социально приемлемым: все понимают, где мы находимся, какой следующий шаг, чем меряем успех и как откатываемся, если что-то пойдёт не так. Определите свой текущий этап, назовите следующий инкремент и договоритесь о критериях — и «большая гора» превратится в серию коротких, понятных подъёмов.

📎 Приложение: Сводная таблица по этапам

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 7
2

Эволюция современной службы поддержки

Generated by Copilot

Generated by Copilot

Эту статью я решил написать после очередного раунда общения с поддержкой одного крупного поставщика ИТ услуг. Я пришёл с конкретной проблемой: симптомы, версии, логи, репро-кейс — всё на месте. В ответ получил аккуратное, холодное: «Это не на нашей стороне. Обратитесь к вашим местным сетевым инженерам». Иными словами — отфутболили.

Такое случается повсеместно, и всё же именно в тот момент я поймал себя на мысли, что уже видел эту картину раньше — только с другой стороны. Я вспомнил свой путь: от «эникейщика» на госслужбе до Service Delivery Manager в международной компании. Я помню время, когда один человек чинил всё — от розетки до кода. И помню, как в больших организациях между командами вырастают стены: обращения ходят по кругу, метрики выглядят прилично, а сервис по-прежнему стоит.

С тех пор у меня простое убеждение: поддержка XXI века обязана измеряться не количеством уровней поддержки, а скоростью и качеством восстановления, не говоря уже о постоянном улучшении сервиса (Continuous Service Improvement, CSI). Не «чей запрос», а «кто взял на себя ответственность довести до результата». Это и есть главная тема этой статьи — как вернуть поддержке цельность и скорость, не потеряв безопасность и зрелость процессов.

Дальше — о том, что мы потеряли на пути от «человека-оркестра» к узкой специализации, и как вернулась назад универсальность, но уже в версии 2.0.

Когда «айтишник» чинил всё

Generated by Copilot

Generated by Copilot

Конец 90-х, начало 2000-х — время, когда ИТ было ближе к ремеслу, чем к выстроенному процессу. В небольших компаниях от одного человека ждали целиком «закрыть контур»: протянуть витую пару и обжать коннектор, переустановить Windows и поднять домен, настроить бэкап и написать скрипт, починить принтер и выправить отчёт в базе. «Человек-оркестр» — не фигура речи, а способ выживания: меньше согласований, выше скорость, ниже стоимость.

В такой среде вырабатывалась полезная привычка — мыслить целостно. Не было никаких очередей и порталов: если у кладовщика не печатается накладная, ты идёшь по цепочке — есть ли бумага, не зажевало ли её, включён ли принтер, жив ли кабель/порт, виден ли принтер в системе, не зависла ли очередь печати, корректно ли установлен драйвер, доступен ли сервер печати, не упал ли свитч, хватает ли прав в приложении, отвечает ли база. И так — пока накладная не выйдет из принтера. Важно было одно: вернуть работу в строй как можно скорее.

Разумеется, у этой модели были издержки. Надёжность держалась на индивидуальном героизме, знания передавались из рук в руки, а документация жила в голове и в папке с утилитами на флешке (если вообще была). Но именно тогда я приобрёл опыт, которым дорожу до сих пор: если можно вернуть систему к жизни за пять минут — это надо делать; а потом уже разбираться, как оформить решение так, чтобы оно стало штатным. Не зная, что такое Agile, я жил по Agile 😅.

Большая машина и толстые стены специализаций

Generated by Copilot

Generated by Copilot

Затем мне повезло поработать в большой федеральной компании. Там не было отдела ИТ — там был целый ИТ-департамент, около 500 человек. Предсказуемость, роли, процессы, регламенты — всё по рельсам. И вместе с этим выросли толстые стены специализаций на стыках команд. Мне пришлось выбрать специализацию, и я выбрал быть DBA — администратором баз данных, хотя очень любил программировать; но тогда DBA платили больше 💸: бэкапы и восстановление, производительность, HA/DR, патчи, соответствие требованиям — моё новое всё.

Я видел это много раз. Ночью падает производительность, прилетает тикет — у пользователей «висит» форма. Мониторинг БД показывает рост ожиданий ввода-вывода. Я подозреваю диски и переназначаю тикет администраторам систем хранения — через час он возвращается с отпиской «проблем не видим». Кидаю тикет сетевикам — ещё через час он возвращается обратно. Пинг-понг повторяется, а проблема не решается. В итоге SLA «протухает», и виноватым становится тот, на чьих руках тикет застал дедлайн. А через сутки выясняется, что причина — просто крошечная настройка на одном из узлов ERP-системы (за эти серверы я вообще не отвечал).

Специализация — не враг. Она дает глубокую экспертизу и качество. Проблема в другом: нет сквозного владения и прочных «мостов» между командами — кто ведёт запрос до конца и отвечает за результат. Именно здесь я впервые по-настоящему почувствовал, что «правильно» — не всегда «полезно» для сервиса.

«Правильно» — не всегда «полезно»

Generated by Copilot

Generated by Copilot

Я хорошо помню это чувство: ты всё делаешь «по правилам», а сервис стоит. Передаёшь дальше, ждёшь ответа, согласовываешь — а людям нужно, чтобы заработало сейчас.

Однажды ночью встал склад: отгрузка уперлась в баг печатной формы. Формально это не моя зона. Я нашёл форму, реверс-инжинирингом в дамп-редакторе нашёл баг, поправил его — что называется, «херак-херак — и в продакшн». Через пять минут конвейер ожил, и компания не потеряла сотни тысяч долларов. Формально это зона ответственности разработчиков; в ту ночь они спали, и даже разбуди их — решение бы затянулось до утра, ведь они играют только по правилам.

И в этот раз я ещё раз убедился — как и в случае с «человеком-оркестром» — что в поддержке действует принцип «сначала восстановить, потом нормализовать»: правильная последовательность — сначала вернуть работу в строй как можно скорее, параллельно фиксируя сделанные шаги и уведомляя владельцев; а уже утром — оформить изменение, поправить код и документацию, коротко разобрать причины. Так эпизод героизма превращается в улучшение процесса — и в следующий раз решает уже не смелость, а система.

Команда «универсалов 2.0»

Generated by Copilot

Generated by Copilot

Став тимлидом, я сделал ставку на управляемую широту. Не «все делают всё», но каждый способен протащить задачу через стык, не роняя мяч. Разработчик — не DevOps-инженер, но умеет собрать простой пайплайн для новой фичи на Jenkins; позже этот пайплайн перепишет профессиональный DevOps, зато работа не стоит и появляется необходимая взаимозаменяемость. Сотрудник поддержки — не бэкендер, но открывает git-репозиторий, читает логи и на языке кода объясняет разработчику, в чём проблема; а в несложных случаях — сам правит код и формирует аккуратный pull request. DBA — не владелец продукта, но может предложить безопасный обходной путь, чтобы бизнес не стоял.

Чтобы это работало, широту пришлось «закрыть рамками». Любая правка идёт через короткий pull request и review; выкладки — маленькими порциями с возможностью отката (а-ля release management и change management); доступы — по принципу наименьших привилегий. Продукт активно обсуждается всей командой на регулярных встречах — поднимаем и кроссфункциональные темы. Так вся команда в курсе, как устроен продукт целиком.

Главный эффект — исчез лишний бег по кругу. Там, где раньше запрос кочевал между очередями, сегодня он движется по прямой: один человек берёт его в работу, зовёт тех, кто нужен, фиксирует шаги — и доводит до результата. Скорость выросла не за счёт героизма, а за счёт реальной командной работы и привычки смотреть на систему целиком. При этом сохраняется ownership: независимо от того, кто решает проблему в данный момент, всегда есть тот, кто знает полную картину.

Круг замкнулся — но на новом витке

Generated by Copilot

Generated by Copilot

Мы и правда вернулись к широте — только осознанной. «Универсал 2.0» — это не человек, который делает всё один, а тот, кто доводит задачу до результата, понимает соседние части системы и вовремя подключает нужных людей.

Краткий манифест современной поддержки

  1. Владение до результата. Запрос имеет владельца до финала.

  2. Скорость решения, но с контролем качества.

  3. Широта — управляемая. T-shape навыки, guardrails, парные дежурства, кросс-обучение.

  4. Прозрачность и учёба. Blameless RCA, чистые runbook’и, обновления после каждого случая.

  5. Метрики по делу. Оцениваем не «сколько перераспределили», а как быстро и стабильно восстановили сервис.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 5

Ответ на пост «Главные ошибки руководителей и кандидатов на собеседовании»1

Generated by Copilot

Generated by Copilot

Поучаствовал в рубрике #УмХорошоДваЛучше владельца Телеграмм канала «Лайфхаки управленца» Сергея Вепренцева

Со своей стороны хотел бы предложить расширенный вариант Ошибок работодателей и кандидатов. и дать больше рекомендаций обеим сторонам
Собеседование — процесс взаимный 🤝. Работодатель ищет компетенции под реальные задачи, кандидат — возможность продать релевантный опыт. При этом кандидат в более уязвимой позиции, значит, задача руководителя — снизить стресс и создать условия, в которых человек раскроется. Когда обе стороны готовятся и ведут честный диалог, собеседование превращается из «экзамена на выживание» в точную проверку совместимости.

Рекомендации руководителю 👔

  1. Требования позиции 🎯
    Требования должны соответствовать на 100% тому, чем кандидат будет заниматься в ближайшие 6 месяцев.

  2. Подготовка к собеседованию 📝
    Читать CV на собеседовании — red flag для кандидата. С ним следует ознакомиться заранее, провести сопоставление с описанием позиции. Приоритизируйте навыки от «наиболее нужных» к «наименее нужным» и ведите интервью по этому порядку. Так за 60 минут можно обсудить действительно важные вещи, а если на что-то не хватит времени — это не будет критично. Обратите внимание на наличие сертификатов: не стоит тратить много времени на уже «подтверждённые» навыки.

  3. Интервьюер — лицо компании 🏢
    По вашему тону и структуре кандидат считывает климат и зрелость. Невежливость, сумбур, несогласованные критерии — частая причина отказа сильных кандидатов, даже при хорошей зарплате.

  4. Практика важнее теории 🛠️
    Интересуйтесь, как кандидат решал/будет решать практические кейсы, а не только знанием теории 📚.

  5. Сортируем core- и развиваемые навыки 🧩
    Core-навыки намного ценнее прочих развиваемых навыков, которые приходят с практикой.

  6. Эмпатия и кооперация 🤝
    Снижайте напряжение.
    «Понимаю, кейс сложный — я и сам не смог бы решить его идеально, но давай порассуждаем».
    «Мы недавно столкнулись с проблемой — мог бы ты посоветовать решение?»
    Допустимы и небольшие подсказки: как в работе, так и на интервью «бриллиант» может раскрыться позже.

  7. Без предвзятости ⚖️
    Во время интервью собирайте данные, уважайте мотивированную позицию кандидата (даже если вы не согласны). Решение — после де-брифа, по единым критериям роли.

Рекомендации кандидату 🧑‍💼

  1. Изучить информацию о компании 🔎
    Понять в интернете, что за компания: что производит, что продаёт. Миссия/видение — если доступны.

  2. Сопоставить описание позиции и собственные навыки 📌
    Разделите требования на core и развиваемые и честно соотнесите их со своими скиллами.

  3. Подготовить короткую речь о себе 🎙️
    Не пересказывайте всю карьеру и список компаний — говорите только релевантное роли:
    — кто вы для этой роли (2–3 сильных core-навыка) 💪;
    — 2 кейса по STAR с метриками ⭐📈;
    — почему это соответствует задачам команды 🎯.

  4. Освежить забытые навыки 🧠
    Перед интервью допустимо «размять память» (конспекты, песочница, ИИ) — но без вранья на встрече. Широкая осведомлённость помогает связать понятия:
    «Blue/Green на практике не делал, но понимаю: два прод-окружения (blue/green), переключение трафика балансировщиком, быстрый rollback без даунтайма».

5. Mock-интервью с помощью ИИ 🤖 Загрузите описание позиции и своё резюме в ИИ и попросите провести mock-интервью: с поведенческими и практическими вопросами, таймингом и обратной связью. Это помогает потренироваться, вычленить слабые места и подготовить ясные ответы по ключевым темам.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью
9

Когнитивные искажения в ИТ: коротко, по-человечески и с примерами

Generated by Copilot

Generated by Copilot

Иногда решения в ИТ принимаются не головой, а… мозгом. А мозг любит экономить батарейку и ошибается по шаблону. Эти «шаблонные ошибки» и называются когнитивными искажениями. Ниже — 10 самых частых ловушек для ИТ менеджеров и команд

🧠 Подтверждающее искажение (Confirmation Bias)

Generated by Copilot

Generated by Copilot

Что это:

Замечаем то, что подтверждает наши прежние убеждения, и пропускаем остальное.

Пример:

Приложение «тормозит» — application support сразу винит DBA: месяц назад после оптимизации базы данных «всё висело», значит и сейчас наверняка виноваты снова они, симптомы похожи на те что были месяц назад. Варианты то что проблемы могут быть в прочих компонентах  приложения (инфраструктура, сеть и пр.) даже не рассматриваются.

Что делать:

Точнее проверяйте факты: Неподтверждённое обвинение может обидеть другую сторону и испортить отношения надолго. Предъявляйте не предположение, а проблему, доказанную конкретными метриками. Используйте корпоративные системы мониторинга, которые охватывают весь стек (приложение, база данных, сетевой слой, инфраструктура) и доступны для анализа широкому кругу участников.

Эффект привязки (Anchoring)

Generated by Copilot

Generated by Copilot

Что это:

Первое число/факт которое попадает в наше поле зрения задаёт «якорь» для дальнейших решений — всё остальное подгоняем к нему.

Пример:

Выбирая вендора для новой системы мониторинга, берём первого из выдачи Google — остальные варианты уже не воспринимаются всерьёз.

Что делать:

Это сильное искажение, от которого нелегко избавиться, но влияние можно уменьшить. До поиска сформулируйте параметры и критерии желаемой системы и выбирайте по соответствию требованиям, а не по порядку выдачи. Соберите несколько альтернатив, представьте их команде в случайном порядке и соберите обратную связь.

💸 Ошибка невозвратных затрат (Sunk Cost Fallacy)

Generated by Copilot

Generated by Copilot

Что это:

Тянем проект/технологию «потому что уже столько вложили», вместо того чтобы смотреть на будущие выгоды.

Пример:

Есть дорогие Enterprise-perpetual-лицензии на Oracle Database — держимся за неё, хотя можно перейти на бесплатную open-source-альтернативу или более экономичный managed-сервис. Решение диктуют прошлые траты.

Что делать:

Делаем новый расчёт с учётом перехода на свежие технологии — вероятные выгоды могут перекрыть потери. Считаем не только деньги, но и будущие «возможности»: скорость вывода фич, гибкость архитектуры, снижение vendor lock-in. Улучшение климата в коллективе и мотивации — тоже бенефит.

📅 Ошибка планирования (Planning Fallacy)

Generated by Copilot

Generated by Copilot

Что это:

Систематически недооцениваем сроки и усилия: в голове — «идеальный мир», в жизни — зависимости, очереди и внезапные «а сертификат то истёк».

Пример:

Задачу планировали сделать за 5 часов, но по ходу всплыли неучтённые сложности — в итоге ушло 10 часов, а ещё пришлось завести пару тикетов в technical debt.

Что делать:

Человек, который окончательно решит задачу точного планирования, получит Нобелевскую премию. А пока используем базовые стратегии: трёхточечные (или шеститочечные) оценки/PERT, «покер планирования» для независимых прикидок и буферы как на уровне задач, так и на уровне проекта.

🧑‍💼Эффект авторитета (Authority Bias)

Generated by Copilot

Generated by Copilot

Что это:

Мнение «большого начальника» автоматически кажется верным: даже если кто-то в команде не согласен, спорить «не принято», и точку зрения руководителя принимают — пусть и с сомнениями.

Пример:

Большой босс говорит: «В прошлой компании мы внедряли этот продукт — выгоды не получили, значит и здесь внедрять не будем». Детали того внедрения (цели, масштаб, настройки, метрики) не раскрываются, но решение фактически принимается «по весу» спикера.

Что делать:

Конструктивно спорить с боссами и «звёздными» коллегами — нормально: опирайтесь на метрики, результаты пилота, TCO/ROI и чёткие критерии. Если убедить руководителя не удалось, заранее зафиксируйте риски и последствия выбранного курса (краткий one-pager/decision record), договоритесь о метриках успеха и триггерах для пересмотра решения.

🐑 Эффект стадности (Bandwagon Effect)

Generated by Copilot

Generated by Copilot

Что это:

«Все так делают — и мы сделаем»: популярность решения подменяет его пригодность именно для нас.

Пример:

Внедряем Prometheus + Grafana для time-series-мониторинга, потому что «это у всех». Хотя у нас монолит на ~200 пользователей, нужен мониторинг здесь и сейчас, и текущий вендорский мониторинг уже закрывает потребности. В итоге получаем лишнюю инфраструктуру и лишнюю точку сбоя — без реальной выгоды.

Что делать:

Когда тянет идти за трендом, сначала выписываем свои use cases и критерии успеха: зачем нам это и какие метрики улучшатся.  Отвечаем на вопросы, кто будет это поддерживать? Не превратится ли это через год в кладбище ненужных технологий? Сравниваем с базовой альтернативой («оставить как есть»/вендорское решение) и принимаем решение по пользе, а не по моде.

🔢 Закон малых чисел (Law of Small Numbers)

Generated by Copilot

Generated by Copilot

Что это:

В малых выборках велик шанс случайных «крайностей» в нетипичных местах: разброс высок, закономерности ещё не проявились — поэтому мы склонны делать большие выводы по маленьким данным.

Примеры:

  • Фидбэк. Получили три отзыва: два нейтрально-негативных и один сильно позитивный. По двум «минусам» делаем вывод, что «всё плохо», хотя выборка слишком мала и легко искажена.

  • Интервью. Пять бесед с «любимыми» клиентами → «фича нужна всем», а реальное использование потом — всего 7%.

Что делать:

Проводите исследования на репрезентативных выборках. Если большую выборку собрать не удается, то убедитесь хотябы что она охватывает как можно больше категорий.

💀Ошибка выжившего (Survivorship Bias)

Generated by Copilot

Generated by Copilot

Что это:

Видим истории успеха, а «кладбище неудач» — нет. Делаем выводы по тем, кто выжил, а не по полной картине.

Пример:

Выбираем платформу observability по витрине «успешных внедрений» и логотипам на сайте вендора. Не спрашиваем, сколько PoC провалилось и в каких условиях те кейсы взлетели — и повторяем чужой путь вне нашего контекста.

Что делать:

Требуем «знаменатель»: сколько компаний пробовало и каков процент успеха/отказов для нашего масштаба и домена. Запрашиваем негативные кейсы и контакты референсов; запускаем короткий пилот с чёткими метриками успеха/остановки и сравниваем с базовой альтернативой (status quo) — решаем по данным, а не по красивым историям.

🎓 Эффект Даннинга–Крюгера (Dunning–Kruger Effect)

Generated by Copilot

Generated by Copilot

Что это:

Люди с низкой компетенцией переоценивают себя, а опытные — осторожничают. Уверенность легко маскируется под экспертизу.

Пример:

Молодой менеджер после 2–3 удачных внедрений воодушевляется, берёт завышенные обязательства на следующий крупный проект — и проваливается. Параллельно мнение опытного менеджера, который трезво оценивал сроки и риски, игнорируется: уверенный новичок «кажется опытнее».

Что делать:

Отделяйте уверенность от компетенций: оценивайте аргументы и данные, а не тон. Учитывайте мнение обеих сторон, просчитывайте риски (допущения, зависимости, план B). Следуйте проверенным процессам и критериям, а не личной симпатии.

🔍 Знание задним числом (Hindsight Bias)

Что это:

После события кажется, что «и так было ясно» — и мы переоцениваем предсказуемость прошлого.

Пример:

На ретро: «Очевидно было, что интеграция сложная!» — хотя в рисках этого не было, а тесты не ловили. Память дорисовала причинность.

Что делать:

Ведите лог предположений до релиза (какие риски и ожидания были), на ретро сравнивайте с записью, а не с памятью. Фиксируйте решения и их основания (decision record), чтобы отличать «тогдашние знания» от «сегодняшней мудрости». Также не скрывайте своих сомнений - активно пишите в почту и в рабочие чаты. В дальнейшем когда все пойдет не так как планировалось - вам будет легче доказать, что конкретно вы это предвидели.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 10
4

Э. Голдратт "Цель" - Новая прочитанная книга в моей библиотеке

Э. Голдратт "Цель" - Новая прочитанная книга в моей библиотеке

Прочитал книгу Цель Э. Голдратта. Есть четкая корреляция с другой книгой «Проект Феникс». Обе книги написаны в жанре романа. В обоих есть патовая ситуация на заводах когда хуже некуда и фирмы на грани банкротства, но всегда появляется некий «гуру» который учит главного героя некой философии. За короткое время получается стабилизировать ситуацию и не только выйти из кризиса, но еще увеличить доход компании.

Ну и как же без параллельной линии связанной с личной жизнью героев. У обоих проблемы с женами , которые решаются ровно в тот момент , когда на работе наступает стабильность.

Ну а в целом рекомендую к прочтению всем кто мало мальски управляет: людьми, проектами, бюджетами, бизнесом -не важно. Теория ограничений (TOC) описанная в книгах - это база для менеджеров любого уровня

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 1

Вариант ретроспективы для ИТ команд (postmortem)

Generated by Copilot

Generated by Copilot

В прошлых статьях я уже рассказывал о Andon Cord, который реализует Continuous Service Improvement (CSI) почти в реальном времени: если что-то идёт не так, мы можем остановить процесс и исправить проблему на месте. Но не всегда это возможно. Поэтому я применяю CSI в ретроспективе — через так называемые Postmortem сессии.

Считаю этот подход своим: он родился из практики RCA (Root Cause Analysis) в рамках Problem Management по ITIL. Возможно, в учебниках есть похожие идеи, но к этому формату я пришёл сам — через реальные кейсы, эксперименты и внедрения под конкретные ограничения команды и продукта.

Когда и как мы это делаем📅

Каждую пятницу, в конце рабочего дня, команда кратко разбирает только закрытые кейсы недели: инциденты, запросы, задачи. Формат — спокойная беседа без поиска виноватых (blameless postmortem), с акцентом на ощущения людей, которые делали работу.

Как проходит сессия🕵️‍♂️

Generated by Copilot

Generated by Copilot

  • 🗣️ Кейс рассказывает тот, кто делал. Узнаём, в чём была задача и что было фактически сделано.

  • 💬 Свободный обмен ощущениями. Делимся, где было неудобно/долго/дублировалось и что вызывало сомнения или напряжение.

  • 📝 Фиксируем наблюдения и маленькие улучшения. Записываем 1–3 конкретные идеи в CSI-бэклог — что убрать, объединить, автоматизировать.

  • 🛠️ Архитектурные сигналы. Отмечаем признаки проблем на уровне архитектуры (узкие места, масштабирование, и пр)

  • 🔄 Границы ответственности. Понимаем, что можно делегировать/передать заказчику и где стоит мягко обновить RACI.

CSI-бэклог: фиксируем идеи сразу💡

Важный результат постмортема — оперативное формирование CSI-бэклога прямо на встрече. Даже в сыром виде, любая идея фиксируется в JIRA — от «галочки» в конфиге до архитектурного рефакторинга.

Принципы:

  • 📝 Записываем всё: Нет «слишком мелких» идей.

  • 📂 Отдельный бэклог: CSI живёт в стороне (отдельный проект/доска), чтобы не портить продуктовые/проектные бэклоги — «не отсвечивает».

Что дальше происходит с CSI-бэклогом 🔄

  • 🔄 Обычный Agile-ритм: Идёт бесконечный refining: уточняем формулировки, укрупняем/дробим, переоцениваем.

  • 📊 Capacity под улучшения: В каждый спринт закладываем 20–30% ёмкости под CSI-задачи. Это дисциплина, а не «по остаточному принципу».

  • 🔁 Многоразовое возвращение: Одни и те же сторис могут обсуждаться на нескольких postmortem и refining сессиях подряд — мы спокойно расширяем, сужаем и шлифуем решение.

  • 🔗 Объединения: Родственные карточки склеиваем в один тикет, чтобы не плодить сущности.

  • ♟️«Ход конём» через проекты: Когда стартует крупная инициатива (например, миграция с on-prem в облако), часть CSI-бэклога можно перенести в проектный бэклог как фичи — если это вписывается в бюджет и расписание. Так технический долг уходит «пакетом», а не годами висит в стороне.

Завершение 🎯

Postmortem-сессии дополняют Andon Cord: первый даёт реакцию «здесь и сейчас», второй — спокойный разбор по горячим следам и системные улучшения. Вместе они замыкают цикл CSI: наблюдаем → обсуждаем без обвинений → фиксируем идеи → превращаем их в работу через отдельный CSI-бэклог и обычный Agile-ритм.

Главная ценность — в дисциплине маленьких шагов. Мы не охотимся за «большим ремонтом», а каждую неделю снимаем трение: убираем лишнее, автоматизируем ручное, уточняем границы ответственности и заранее замечаем архитектурные сигналы. От этого растут предсказуемость, скорость потока и спокойствие команды.

Если хотите начать просто: уже в эту пятницу разберите 2–3 закрытых кейса, зафиксируйте 1–3 идеи в CSI-бэклог и заложите 20–30% capacity следующего спринта под эти улучшения. Всё остальное приложится.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 1
2

Andon Cord (вторая серия) Как Andon Cord помогает даже там, где никто об этом не думал

Generated by Copilot

Generated by Copilot

"В те времена Мир был таким первозданным, что многие вещи не имели названия, и на них просто тыкали пальцем..."
— Г.Г. Маркес, Сто лет одиночества

Эту цитату я вспоминаю всякий раз, когда сталкиваюсь с концепцией, которая кажется чуждой или совершенно не подходящей на первый взгляд. Одна из таких идей — Andon Cord. В своей прошлой статье я подробно рассказал о том, как эта практика помогает решать проблемы в производственных процессах. Однако многие возражали, мол, это для менеджеров и исключительно для фабрик. На самом деле, Andon Cord применим в любых условиях, в частности в  IT это краеугольный камень такой чисто ИТшной философии как DevOps. Давайте расскажу на конкретном примере из моей собственной практики.

Как всё начиналось

Дело было в далёком 2014 году. Я работал в команде DBA (администраторов баз данных) на одном крупном проекте. Поддержка баз данных — дело серьёзное, особенно когда они служат основой критичных бизнес-приложений. Цена ошибки была высока, и ни один специалист от этих ошибок не был застрахован.

Но проблема была не только в ошибках. Основная сложность крылась в доступе к знаниям. В то время понятие о базе знаний типа Confluence было ещё достаточно размытым, не говоря уже о практике её использования. На этом проекте баз знаний, как организованной системы, в принципе не существовало.

Знания между коллегами передавались из уст в уста, через почту или, если повезёт, в виде Word-документов. При этом каждый из них мог лежать где угодно: от папок на рабочем столе до общего сетевого диска под литерой O:.

Естественно, в этой среде были более «прожаренные» специалисты и менее «прожаренные». Два сотрудника могли выполнять одну и ту же типовую операцию, но с совсем разным результатом. Сложные операции при этом выполняли только «избранные» сотрудники, обладавшие значительным опытом.

В целом, уровень работы можно было бы охарактеризовать как "Repeatable" по CMM (Capability Maturity Model). Да, были определённые процессы и минимальная последовательность действий, но всё держалось на индивидуальном опыте и навыках сотрудников, а не на стандартизированных практиках.

Мечты о порядке и японская философия

Именно в это время я начал готовиться к своей будущей роли менеджера (хотя пока это были скорее мечты). Я изучал книги по японской философии управления (TPS, Toyota Production System) и Тайм-менеджменту (Getting Things Done). А к тому же, в этой компании был замечательный принцип: "Всегда есть время сделать всё хорошо".

Особенно сильно меня вдохновили два принципа, которые я выделил для себя.

Первый: если что-то идёт не так, лучше сделать паузу. Разобраться с проблемой, навести порядок, обновить или создать соответствующую документацию, чтобы решить её навсегда. Ещё лучше — сразу донести открытие до коллег: через общий митинг или, по крайней мере, корпоративный чат. Этот принцип учил меня быть проактивным и устранять корень проблемы, а не "залатывать дыры на бегу".

Второй: если сталкиваешься с делом, которое занимает не больше двух минут, сделай его сразу. Опыт показал, что такие задачи решаются быстрее, чем процесс их диспетчеризации и последующего выполнения "потом". Как только ты откладываешь их в очередь, они начинают отнимать больше времени: на напоминания, планирование, управление задачей и переключение контекста. Решение здесь и сейчас — это маленькая инвестиция, которая экономит ресурсы в долгосрочной перспективе.

Кошмар ручного Andon Cord

Но всё пошло несколько не так, как я предполагал. Проблем было так много, что мне приходилось слишком часто дергать этот "Andon cord", превращая свою работу в настоящий кошмар. Сложных ситуаций хватало на каждый день, а решения требовали постоянного переключения между задачами. Двухминутные таски, которые я старался выполнять сразу, тоже прилетали в самое неподходящее время, добавляя ещё больше стресса.

Я уже хотел сдаться. Такой кошмар длился несколько месяцев (возможно, два). Но я по натуре человек довольно упорный. И в один прекрасный день я вдруг осознал: кошмара уже давно нет. Даже не почувствовал, как всё нормализовалось.

Важная находка — Knowledge Base

При той же самой рабочей нагрузке отдел работал с этими задачами намного спокойнее и организованнее. Все типовые операции были задокументированы в Knowledge Base (KB). Удача заключалась в том, что я обнаружил модуль Knowledge Management в нашей ITSM системе Remedy, хотя им никто не пользовался. Я начал создавать статьи с описанием типовых процедур и решений. Например, когда коллеги спрашивали, как пропатчить базу данных, я просто отсылал их к статье в KB с номером KB352354 (Oracle database patching).

Систематизация процессов дала второй результат: благодаря детальному описанию операций и внедрению стандарта удалось перевести технически ответственные задачи с уровня L3 на уровень L2. Это было настоящим достижением для команды, так как более простые ошибки и запросы теперь успешно решались менее опытными специалистами, беря нагрузку с плеч сотрудников уровня L3.

Завершение

Завершая этот рассказ, хочу отметить важное: Andon Cord — это не только для менеджеров. Как минимум у каждого из нас есть один подчинённый, кем мы управляем каждый день, — мы сами.

Кроме того, каждый из нас способен драйвить изменения, независимо от того, на каком уровне мы находимся. Достаточно сделать шаг в сторону улучшения, увидеть проблему и найти способ её исправить. Если Магомет не идёт к горе, гора идёт к Магомету. Возможно, вам не сразу удастся добиться порядка и системности, но упорство и осознанный подход рано или поздно дадут результат.

Andon Cord — это не просто инструмент, это философия действий. Она напоминает о важности не бояться делать паузу, замечать проблему и исправлять её навсегда. А ещё — не забывать, что время всегда есть, нужно только направить его в правильное русло.

Читайте мою серию: Усталый Босс

Прошлые статьи:

Показать полностью 1
Отличная работа, все прочитано!