Профиль навыка

Disaster Recovery Design

RPO/RTO, мультирегиональность, failover-стратегии, бэкапы, планы восстановления

Архитектура и проектирование System Design

Ролей

9

где встречается этот навык

Грейдов

5

сформированная дорожка роста

Обязательных требований

24

ещё 18 — необязательные

Домен

Архитектура и проектирование

Группа

System Design

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль Обязательность Описание
Cloud Engineer Понимает базовые концепции аварийного восстановления для облака: стратегии бэкапов, RPO/RTO и зоны доступности. Следует командным процедурам выполнения DR-runbook'ов и проверки целостности бэкапов.
Database Engineer / DBA Понимает базовые архитектурные концепции Disaster Recovery Design. Следует архитектурным решениям команды. Понимает основные паттерны.
DevOps Engineer Понимает концепции DR: RPO, RTO, backup/restore, hot/warm/cold standby. Выполняет бэкапирование по расписанию, проверяет целостность бэкапов по инструкции. Знает основные риски и сценарии сбоев в облачной инфраструктуре.
Infrastructure Engineer Понимает базовые концепции аварийного восстановления: типы бэкапов (полный, инкрементальный, дифференциальный), процедуры восстановления и основы failover. Следует гайдлайнам команды по верификации бэкапов, тестированию restore и проверкам аппаратной избыточности.
Network Engineer Знает базовые концепции disaster recovery для network engineer и умеет применять их в типовых задачах. Использует стандартные инструменты и следует установленным практикам команды. Понимает когда и почему применяется данный подход.
Platform Engineer Понимает RPO/RTO метрики для платформенных сервисов. Участвует в DR-drills по runbooks: проверяет работоспособность backup-ов, тестирует restore процедуры. Настраивает базовые backup-политики (Velero для K8s, AWS Backup). Документирует результаты DR-тестирования
Site Reliability Engineer (SRE) Понимает DR-концепции: RPO, RTO, backup types. Следует DR-процедурам: failover runbooks, backup verification. Участвует в DR-drills.
Роль Обязательность Описание
Cloud Engineer Применяет проектирование DR для облачных нагрузок: multi-AZ деплои, кросс-региональная репликация, автоматический failover через Route 53/Traffic Manager. Реализует автоматизацию бэкапов с lifecycle policies и проводит регулярные DR-учения.
Database Engineer / DBA Участвует в DR-процессах: выполняет backup verification, тестирует restore procedures по runbooks. Настраивает automated snapshots и cross-region backup копирование. Мониторит replication lag и backup status.
DevOps Engineer Реализует DR-решения: автоматизированные бэкапы (Velero для Kubernetes, AWS Backup), репликация данных между регионами. Настраивает automated failover для баз данных, тестирует restore-процедуры. Документирует DR-планы и runbooks.
Engineering Manager Применяет DR-планирование в оценках рисков проектов и обсуждениях бизнес-непрерывности. Понимает компромиссы между стоимостью DR и возможностями восстановления. Координирует участие команды в DR-учениях и упражнениях по реагированию на инциденты.
Infrastructure Engineer Применяет проектирование DR для on-premise и гибридной инфраструктуры: конфигурации RAID, репликация SAN, warm/hot standby серверы. Реализует автоматизированные расписания бэкапов и проводит ежеквартальное DR-тестирование с документированными процедурами восстановления.
Network Engineer Уверенно применяет disaster recovery для network engineer при решении нестандартных задач. Самостоятельно выбирает оптимальный подход и инструменты. Анализирует trade-offs и предлагает улучшения существующих решений.
Platform Engineer Настраивает DR-инфраструктуру платформы: Velero backup schedules, cross-region S3 replication, database replicas. Создаёт automated DR runbooks для ключевых сервисов. Проводит quarterly DR-drills и анализирует gaps. Настраивает monitoring для RPO compliance
Site Reliability Engineer (SRE) Реализует DR-решения: automated backups, cross-region replication, failover testing. Документирует DR-планы. Настраивает backup monitoring и alerting на backup failures.
Роль Обязательность Описание
Cloud Engineer Обязателен Проектирует DR-архитектуру для мультиоблачных сред: pilot light, warm standby и multi-site active-active паттерны. Внедряет chaos engineering для валидации DR. Принимает ADR-решения по компромиссам RPO/RTO и оптимизации стоимости устойчивости.
Database Engineer / DBA Обязателен Проектирует DR для database tier: multi-region replication, automated failover (Patroni, MHA), backup verification through automated restores. Определяет RPO/RTO для разных tier-ов. Проводит DR drills.
DevOps Engineer Обязателен Проектирует DR-архитектуру: multi-region active-passive и active-active конфигурации, автоматический failover с DNS. Внедряет chaos engineering (Chaos Monkey, Litmus) для валидации DR. Определяет RPO/RTO для каждого сервиса, автоматизирует DR-тестирование.
Engineering Manager Обязателен Проектирует DR-процессы в соответствии с требованиями бизнес-непрерывности и compliance. Оценивает ROI инвестиций в DR и согласовывает целевые RPO/RTO со стейкхолдерами. Устанавливает регулярный каданс DR-тестирования и практики post-mortem ревью.
Infrastructure Engineer Обязателен Проектирует disaster recovery для критической инфраструктуры: multi-AZ архитектура с автоматическим failover, бэкап стратегия с cross-region репликацией, runbook-и для восстановления. Настраивает автоматическое тестирование DR через chaos engineering (Chaos Monkey, Litmus), определяет RPO/RTO для каждого компонента.
Network Engineer Экспертно применяет disaster recovery для network engineer для проектирования сложных систем. Оптимизирует существующие решения и предотвращает архитектурные ошибки. Проводит code review и обучает коллег лучшим практикам.
Platform Engineer Обязателен Проектирует DR-архитектуру для IDP: multi-region active-passive, pilot light, warm standby для платформенных компонентов. Внедряет chaos engineering (Litmus, Gremlin) для валидации DR-планов. Создаёт automated failover с DNS-based switching и health-check driven promotion
Site Reliability Engineer (SRE) Обязателен Проектирует DR-архитектуру: active-passive vs active-active, pilot light, warm standby. Реализует automated failover. Проводит chaos engineering для DR validation. Определяет RTO/RPO по tier-ам.
Solutions Architect Обязателен Проектирует корпоративную DR-архитектуру с мультирегиональным failover, стратегиями репликации данных и автоматической оркестрацией восстановления. Оценивает нефункциональные требования к устойчивости. Принимает ADR-решения по паттернам active-passive vs active-active.
Роль Обязательность Описание
Cloud Engineer Обязателен Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Database Engineer / DBA Обязателен Определяет DR-стандарты для data-платформы: RPO/RTO по tier-ам, DR testing schedule, failover procedures. Координирует DR drills с cross-functional командами. Формирует incident playbooks для database failures.
DevOps Engineer Обязателен Определяет DR-стратегию организации: классификация сервисов по критичности, стандарты RPO/RTO для каждого tier. Проектирует платформу автоматизированного DR-тестирования, процессы game days и tabletop exercises. Управляет DR-бюджетом и приоритизацией.
Engineering Manager Обязателен Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Infrastructure Engineer Обязателен Определяет DR-стандарты для инфраструктуры организации: классификация сервисов по критичности (Tier 1-4), стандартные DR-паттерны для каждого tier-а, регулярные DR-drill-ы. Ревьюит DR-планы команд, внедряет automated failover testing и координирует ежеквартальные учения по восстановлению после сбоев.
Network Engineer Устанавливает стандарты применения disaster recovery для network engineer в команде и принимает архитектурные решения. Определяет технический roadmap с учётом данного навыка. Менторит senior инженеров и влияет на практики смежных команд.
Platform Engineer Обязателен Определяет DR-стратегию организации: tiered RPO/RTO по критичности сервисов, budget allocation, compliance requirements. Руководит проведением game days и tabletop exercises для DR-планов. Проектирует organizational DR governance с регулярным review и improvement циклом
Site Reliability Engineer (SRE) Обязателен Определяет DR-стандарты организации: tiered recovery model, mandatory DR-testing schedule, communication plan. Координирует cross-team DR drills. Внедряет DR metrics.
Solutions Architect Обязателен Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Роль Обязательность Описание
Cloud Engineer Обязателен Формирует DR-стратегию на уровне организации: multi-region active-active vs pilot light vs warm standby, RPO/RTO матрица по criticality. Проектирует автоматизированный failover через Route 53 health checks и cross-region replication. Организует регулярные DR-учения и gameday exercises.
Database Engineer / DBA Обязателен Формирует disaster recovery стратегию организации: multi-region active-active vs active-passive, cross-cloud DR, RTO/RPO frameworks. Определяет DR governance, compliance requirements, и инвестиции в database resilience.
DevOps Engineer Обязателен Разрабатывает корпоративную стратегию business continuity и disaster recovery: мульти-облачный DR, автоматизированный failover для всей платформы. Определяет архитектуру resilience engineering: chaos engineering culture, gameday framework, continuous DR validation.
Engineering Manager Обязателен Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.
Infrastructure Engineer Обязателен Формирует стратегию Business Continuity и Disaster Recovery для компании: архитектура active-active multi-region, DR для мульти-облачных сред, compliance с regulatory DR requirements. Определяет инвестиции в DR-инфраструктуру, проектирует сценарии полной потери региона и координирует DR-стратегию с руководством компании.
Network Engineer Формирует стратегию применения disaster recovery для network engineer на уровне организации. Определяет best practices и влияет на выбор технологий за пределами своей команды. Является признанным экспертом в данной области.
Platform Engineer Обязателен Формирует стратегию business continuity для платформы: active-active multi-region, cell-based architecture для blast radius isolation. Определяет архитектурные паттерны для resilient distributed systems. Консультирует board по risk management и compliance для mission-critical платформы
Site Reliability Engineer (SRE) Обязателен Проектирует organizational DR стратегию: multi-region architecture, data sovereignty compliance, full-stack failover automation. Определяет business continuity framework.
Solutions Architect Обязателен Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для Disaster Recovery Design
Загрузка комментариев...