Профиль навыка

Disaster Recovery Design

RPO/RTO, мультирегиональность, failover-стратегии, бэкапы, планы восстановления

Архитектура и проектирование System Design

Ролей

где встречается этот навык

Грейдов

сформированная дорожка роста

Обязательных требований

ещё 18 — необязательные

Домен

Архитектура и проектирование

Группа

System Design

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль	Обязательность	Описание
Cloud Engineer		Понимает базовые концепции аварийного восстановления для облака: стратегии бэкапов, RPO/RTO и зоны доступности. Следует командным процедурам выполнения DR-runbook'ов и проверки целостности бэкапов.
Database Engineer / DBA		Понимает базовые архитектурные концепции Disaster Recovery Design. Следует архитектурным решениям команды. Понимает основные паттерны.
DevOps Engineer		Понимает концепции DR: RPO, RTO, backup/restore, hot/warm/cold standby. Выполняет бэкапирование по расписанию, проверяет целостность бэкапов по инструкции. Знает основные риски и сценарии сбоев в облачной инфраструктуре.
Infrastructure Engineer		Понимает базовые концепции аварийного восстановления: типы бэкапов (полный, инкрементальный, дифференциальный), процедуры восстановления и основы failover. Следует гайдлайнам команды по верификации бэкапов, тестированию restore и проверкам аппаратной избыточности.
Network Engineer		Знает базовые концепции disaster recovery для network engineer и умеет применять их в типовых задачах. Использует стандартные инструменты и следует установленным практикам команды. Понимает когда и почему применяется данный подход.
Platform Engineer		Понимает RPO/RTO метрики для платформенных сервисов. Участвует в DR-drills по runbooks: проверяет работоспособность backup-ов, тестирует restore процедуры. Настраивает базовые backup-политики (Velero для K8s, AWS Backup). Документирует результаты DR-тестирования
Site Reliability Engineer (SRE)		Понимает DR-концепции: RPO, RTO, backup types. Следует DR-процедурам: failover runbooks, backup verification. Участвует в DR-drills.

Роль	Обязательность	Описание
Cloud Engineer		Применяет проектирование DR для облачных нагрузок: multi-AZ деплои, кросс-региональная репликация, автоматический failover через Route 53/Traffic Manager. Реализует автоматизацию бэкапов с lifecycle policies и проводит регулярные DR-учения.
Database Engineer / DBA		Участвует в DR-процессах: выполняет backup verification, тестирует restore procedures по runbooks. Настраивает automated snapshots и cross-region backup копирование. Мониторит replication lag и backup status.
DevOps Engineer		Реализует DR-решения: автоматизированные бэкапы (Velero для Kubernetes, AWS Backup), репликация данных между регионами. Настраивает automated failover для баз данных, тестирует restore-процедуры. Документирует DR-планы и runbooks.
Engineering Manager		Применяет DR-планирование в оценках рисков проектов и обсуждениях бизнес-непрерывности. Понимает компромиссы между стоимостью DR и возможностями восстановления. Координирует участие команды в DR-учениях и упражнениях по реагированию на инциденты.
Infrastructure Engineer		Применяет проектирование DR для on-premise и гибридной инфраструктуры: конфигурации RAID, репликация SAN, warm/hot standby серверы. Реализует автоматизированные расписания бэкапов и проводит ежеквартальное DR-тестирование с документированными процедурами восстановления.
Network Engineer		Уверенно применяет disaster recovery для network engineer при решении нестандартных задач. Самостоятельно выбирает оптимальный подход и инструменты. Анализирует trade-offs и предлагает улучшения существующих решений.
Platform Engineer		Настраивает DR-инфраструктуру платформы: Velero backup schedules, cross-region S3 replication, database replicas. Создаёт automated DR runbooks для ключевых сервисов. Проводит quarterly DR-drills и анализирует gaps. Настраивает monitoring для RPO compliance
Site Reliability Engineer (SRE)		Реализует DR-решения: automated backups, cross-region replication, failover testing. Документирует DR-планы. Настраивает backup monitoring и alerting на backup failures.

Роль	Обязательность	Описание
Cloud Engineer	Обязателен	Проектирует DR-архитектуру для мультиоблачных сред: pilot light, warm standby и multi-site active-active паттерны. Внедряет chaos engineering для валидации DR. Принимает ADR-решения по компромиссам RPO/RTO и оптимизации стоимости устойчивости.
Database Engineer / DBA	Обязателен	Проектирует DR для database tier: multi-region replication, automated failover (Patroni, MHA), backup verification through automated restores. Определяет RPO/RTO для разных tier-ов. Проводит DR drills.
DevOps Engineer	Обязателен	Проектирует DR-архитектуру: multi-region active-passive и active-active конфигурации, автоматический failover с DNS. Внедряет chaos engineering (Chaos Monkey, Litmus) для валидации DR. Определяет RPO/RTO для каждого сервиса, автоматизирует DR-тестирование.
Engineering Manager	Обязателен	Проектирует DR-процессы в соответствии с требованиями бизнес-непрерывности и compliance. Оценивает ROI инвестиций в DR и согласовывает целевые RPO/RTO со стейкхолдерами. Устанавливает регулярный каданс DR-тестирования и практики post-mortem ревью.
Infrastructure Engineer	Обязателен	Проектирует disaster recovery для критической инфраструктуры: multi-AZ архитектура с автоматическим failover, бэкап стратегия с cross-region репликацией, runbook-и для восстановления. Настраивает автоматическое тестирование DR через chaos engineering (Chaos Monkey, Litmus), определяет RPO/RTO для каждого компонента.
Network Engineer		Экспертно применяет disaster recovery для network engineer для проектирования сложных систем. Оптимизирует существующие решения и предотвращает архитектурные ошибки. Проводит code review и обучает коллег лучшим практикам.
Platform Engineer	Обязателен	Проектирует DR-архитектуру для IDP: multi-region active-passive, pilot light, warm standby для платформенных компонентов. Внедряет chaos engineering (Litmus, Gremlin) для валидации DR-планов. Создаёт automated failover с DNS-based switching и health-check driven promotion
Site Reliability Engineer (SRE)	Обязателен	Проектирует DR-архитектуру: active-passive vs active-active, pilot light, warm standby. Реализует automated failover. Проводит chaos engineering для DR validation. Определяет RTO/RPO по tier-ам.
Solutions Architect	Обязателен	Проектирует корпоративную DR-архитектуру с мультирегиональным failover, стратегиями репликации данных и автоматической оркестрацией восстановления. Оценивает нефункциональные требования к устойчивости. Принимает ADR-решения по паттернам active-passive vs active-active.

Роль	Обязательность	Описание
Cloud Engineer	Обязателен	Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Database Engineer / DBA	Обязателен	Определяет DR-стандарты для data-платформы: RPO/RTO по tier-ам, DR testing schedule, failover procedures. Координирует DR drills с cross-functional командами. Формирует incident playbooks для database failures.
DevOps Engineer	Обязателен	Определяет DR-стратегию организации: классификация сервисов по критичности, стандарты RPO/RTO для каждого tier. Проектирует платформу автоматизированного DR-тестирования, процессы game days и tabletop exercises. Управляет DR-бюджетом и приоритизацией.
Engineering Manager	Обязателен	Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Infrastructure Engineer	Обязателен	Определяет DR-стандарты для инфраструктуры организации: классификация сервисов по критичности (Tier 1-4), стандартные DR-паттерны для каждого tier-а, регулярные DR-drill-ы. Ревьюит DR-планы команд, внедряет automated failover testing и координирует ежеквартальные учения по восстановлению после сбоев.
Network Engineer		Устанавливает стандарты применения disaster recovery для network engineer в команде и принимает архитектурные решения. Определяет технический roadmap с учётом данного навыка. Менторит senior инженеров и влияет на практики смежных команд.
Platform Engineer	Обязателен	Определяет DR-стратегию организации: tiered RPO/RTO по критичности сервисов, budget allocation, compliance requirements. Руководит проведением game days и tabletop exercises для DR-планов. Проектирует organizational DR governance с регулярным review и improvement циклом
Site Reliability Engineer (SRE)	Обязателен	Определяет DR-стандарты организации: tiered recovery model, mandatory DR-testing schedule, communication plan. Координирует cross-team DR drills. Внедряет DR metrics.
Solutions Architect	Обязателен	Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.

Роль	Обязательность	Описание
Cloud Engineer	Обязателен	Формирует DR-стратегию на уровне организации: multi-region active-active vs pilot light vs warm standby, RPO/RTO матрица по criticality. Проектирует автоматизированный failover через Route 53 health checks и cross-region replication. Организует регулярные DR-учения и gameday exercises.
Database Engineer / DBA	Обязателен	Формирует disaster recovery стратегию организации: multi-region active-active vs active-passive, cross-cloud DR, RTO/RPO frameworks. Определяет DR governance, compliance requirements, и инвестиции в database resilience.
DevOps Engineer	Обязателен	Разрабатывает корпоративную стратегию business continuity и disaster recovery: мульти-облачный DR, автоматизированный failover для всей платформы. Определяет архитектуру resilience engineering: chaos engineering culture, gameday framework, continuous DR validation.
Engineering Manager	Обязателен	Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.
Infrastructure Engineer	Обязателен	Формирует стратегию Business Continuity и Disaster Recovery для компании: архитектура active-active multi-region, DR для мульти-облачных сред, compliance с regulatory DR requirements. Определяет инвестиции в DR-инфраструктуру, проектирует сценарии полной потери региона и координирует DR-стратегию с руководством компании.
Network Engineer		Формирует стратегию применения disaster recovery для network engineer на уровне организации. Определяет best practices и влияет на выбор технологий за пределами своей команды. Является признанным экспертом в данной области.
Platform Engineer	Обязателен	Формирует стратегию business continuity для платформы: active-active multi-region, cell-based architecture для blast radius isolation. Определяет архитектурные паттерны для resilient distributed systems. Консультирует board по risk management и compliance для mission-critical платформы
Site Reliability Engineer (SRE)	Обязателен	Проектирует organizational DR стратегию: multi-region architecture, data sovereignty compliance, full-stack failover automation. Определяет business continuity framework.
Solutions Architect	Обязателен	Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.

Junior 7 требований

Cloud Engineer

Понимает базовые концепции аварийного восстановления для облака: стратегии бэкапов, RPO/RTO и зоны доступности. Следует командным процедурам выполнения DR-runbook'ов и проверки целостности бэкапов.
Database Engineer / DBA

Понимает базовые архитектурные концепции Disaster Recovery Design. Следует архитектурным решениям команды. Понимает основные паттерны.
DevOps Engineer

Понимает концепции DR: RPO, RTO, backup/restore, hot/warm/cold standby. Выполняет бэкапирование по расписанию, проверяет целостность бэкапов по инструкции. Знает основные риски и сценарии сбоев в облачной инфраструктуре.

Infrastructure Engineer

Понимает базовые концепции аварийного восстановления: типы бэкапов (полный, инкрементальный, дифференциальный), процедуры восстановления и основы failover. Следует гайдлайнам команды по верификации бэкапов, тестированию restore и проверкам аппаратной избыточности.
Network Engineer

Знает базовые концепции disaster recovery для network engineer и умеет применять их в типовых задачах. Использует стандартные инструменты и следует установленным практикам команды. Понимает когда и почему применяется данный подход.
Platform Engineer

Понимает RPO/RTO метрики для платформенных сервисов. Участвует в DR-drills по runbooks: проверяет работоспособность backup-ов, тестирует restore процедуры. Настраивает базовые backup-политики (Velero для K8s, AWS Backup). Документирует результаты DR-тестирования
Site Reliability Engineer (SRE)

Понимает DR-концепции: RPO, RTO, backup types. Следует DR-процедурам: failover runbooks, backup verification. Участвует в DR-drills.

Middle 8 требований

Cloud Engineer

Применяет проектирование DR для облачных нагрузок: multi-AZ деплои, кросс-региональная репликация, автоматический failover через Route 53/Traffic Manager. Реализует автоматизацию бэкапов с lifecycle policies и проводит регулярные DR-учения.
Database Engineer / DBA

Участвует в DR-процессах: выполняет backup verification, тестирует restore procedures по runbooks. Настраивает automated snapshots и cross-region backup копирование. Мониторит replication lag и backup status.
DevOps Engineer

Реализует DR-решения: автоматизированные бэкапы (Velero для Kubernetes, AWS Backup), репликация данных между регионами. Настраивает automated failover для баз данных, тестирует restore-процедуры. Документирует DR-планы и runbooks.

Engineering Manager

Применяет DR-планирование в оценках рисков проектов и обсуждениях бизнес-непрерывности. Понимает компромиссы между стоимостью DR и возможностями восстановления. Координирует участие команды в DR-учениях и упражнениях по реагированию на инциденты.
Infrastructure Engineer

Применяет проектирование DR для on-premise и гибридной инфраструктуры: конфигурации RAID, репликация SAN, warm/hot standby серверы. Реализует автоматизированные расписания бэкапов и проводит ежеквартальное DR-тестирование с документированными процедурами восстановления.
Network Engineer

Уверенно применяет disaster recovery для network engineer при решении нестандартных задач. Самостоятельно выбирает оптимальный подход и инструменты. Анализирует trade-offs и предлагает улучшения существующих решений.
Platform Engineer

Настраивает DR-инфраструктуру платформы: Velero backup schedules, cross-region S3 replication, database replicas. Создаёт automated DR runbooks для ключевых сервисов. Проводит quarterly DR-drills и анализирует gaps. Настраивает monitoring для RPO compliance
Site Reliability Engineer (SRE)

Реализует DR-решения: automated backups, cross-region replication, failover testing. Документирует DR-планы. Настраивает backup monitoring и alerting на backup failures.

Senior 9 требований

Cloud Engineer
Обязателен

Проектирует DR-архитектуру для мультиоблачных сред: pilot light, warm standby и multi-site active-active паттерны. Внедряет chaos engineering для валидации DR. Принимает ADR-решения по компромиссам RPO/RTO и оптимизации стоимости устойчивости.
Database Engineer / DBA
Обязателен

Проектирует DR для database tier: multi-region replication, automated failover (Patroni, MHA), backup verification through automated restores. Определяет RPO/RTO для разных tier-ов. Проводит DR drills.
DevOps Engineer
Обязателен

Проектирует DR-архитектуру: multi-region active-passive и active-active конфигурации, автоматический failover с DNS. Внедряет chaos engineering (Chaos Monkey, Litmus) для валидации DR. Определяет RPO/RTO для каждого сервиса, автоматизирует DR-тестирование.

Engineering Manager
Обязателен

Проектирует DR-процессы в соответствии с требованиями бизнес-непрерывности и compliance. Оценивает ROI инвестиций в DR и согласовывает целевые RPO/RTO со стейкхолдерами. Устанавливает регулярный каданс DR-тестирования и практики post-mortem ревью.
Infrastructure Engineer
Обязателен

Проектирует disaster recovery для критической инфраструктуры: multi-AZ архитектура с автоматическим failover, бэкап стратегия с cross-region репликацией, runbook-и для восстановления. Настраивает автоматическое тестирование DR через chaos engineering (Chaos Monkey, Litmus), определяет RPO/RTO для каждого компонента.
Network Engineer

Экспертно применяет disaster recovery для network engineer для проектирования сложных систем. Оптимизирует существующие решения и предотвращает архитектурные ошибки. Проводит code review и обучает коллег лучшим практикам.
Platform Engineer
Обязателен

Проектирует DR-архитектуру для IDP: multi-region active-passive, pilot light, warm standby для платформенных компонентов. Внедряет chaos engineering (Litmus, Gremlin) для валидации DR-планов. Создаёт automated failover с DNS-based switching и health-check driven promotion
Site Reliability Engineer (SRE)
Обязателен

Проектирует DR-архитектуру: active-passive vs active-active, pilot light, warm standby. Реализует automated failover. Проводит chaos engineering для DR validation. Определяет RTO/RPO по tier-ам.
Solutions Architect
Обязателен

Проектирует корпоративную DR-архитектуру с мультирегиональным failover, стратегиями репликации данных и автоматической оркестрацией восстановления. Оценивает нефункциональные требования к устойчивости. Принимает ADR-решения по паттернам active-passive vs active-active.

Lead / Staff 9 требований

Cloud Engineer
Обязателен

Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Database Engineer / DBA
Обязателен

Определяет DR-стандарты для data-платформы: RPO/RTO по tier-ам, DR testing schedule, failover procedures. Координирует DR drills с cross-functional командами. Формирует incident playbooks для database failures.
DevOps Engineer
Обязателен

Определяет DR-стратегию организации: классификация сервисов по критичности, стандарты RPO/RTO для каждого tier. Проектирует платформу автоматизированного DR-тестирования, процессы game days и tabletop exercises. Управляет DR-бюджетом и приоритизацией.

Engineering Manager
Обязателен

Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.
Infrastructure Engineer
Обязателен

Определяет DR-стандарты для инфраструктуры организации: классификация сервисов по критичности (Tier 1-4), стандартные DR-паттерны для каждого tier-а, регулярные DR-drill-ы. Ревьюит DR-планы команд, внедряет automated failover testing и координирует ежеквартальные учения по восстановлению после сбоев.
Network Engineer

Устанавливает стандарты применения disaster recovery для network engineer в команде и принимает архитектурные решения. Определяет технический roadmap с учётом данного навыка. Менторит senior инженеров и влияет на практики смежных команд.
Platform Engineer
Обязателен

Определяет DR-стратегию организации: tiered RPO/RTO по критичности сервисов, budget allocation, compliance requirements. Руководит проведением game days и tabletop exercises для DR-планов. Проектирует organizational DR governance с регулярным review и improvement циклом
Site Reliability Engineer (SRE)
Обязателен

Определяет DR-стандарты организации: tiered recovery model, mandatory DR-testing schedule, communication plan. Координирует cross-team DR drills. Внедряет DR metrics.
Solutions Architect
Обязателен

Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review.

Principal 9 требований

Cloud Engineer
Обязателен

Формирует DR-стратегию на уровне организации: multi-region active-active vs pilot light vs warm standby, RPO/RTO матрица по criticality. Проектирует автоматизированный failover через Route 53 health checks и cross-region replication. Организует регулярные DR-учения и gameday exercises.
Database Engineer / DBA
Обязателен

Формирует disaster recovery стратегию организации: multi-region active-active vs active-passive, cross-cloud DR, RTO/RPO frameworks. Определяет DR governance, compliance requirements, и инвестиции в database resilience.
DevOps Engineer
Обязателен

Разрабатывает корпоративную стратегию business continuity и disaster recovery: мульти-облачный DR, автоматизированный failover для всей платформы. Определяет архитектуру resilience engineering: chaos engineering culture, gameday framework, continuous DR validation.

Engineering Manager
Обязателен

Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.
Infrastructure Engineer
Обязателен

Формирует стратегию Business Continuity и Disaster Recovery для компании: архитектура active-active multi-region, DR для мульти-облачных сред, compliance с regulatory DR requirements. Определяет инвестиции в DR-инфраструктуру, проектирует сценарии полной потери региона и координирует DR-стратегию с руководством компании.
Network Engineer

Формирует стратегию применения disaster recovery для network engineer на уровне организации. Определяет best practices и влияет на выбор технологий за пределами своей команды. Является признанным экспертом в данной области.
Platform Engineer
Обязателен

Формирует стратегию business continuity для платформы: active-active multi-region, cell-based architecture для blast radius isolation. Определяет архитектурные паттерны для resilient distributed systems. Консультирует board по risk management и compliance для mission-critical платформы
Site Reliability Engineer (SRE)
Обязателен

Проектирует organizational DR стратегию: multi-region architecture, data sovereignty compliance, full-stack failover automation. Определяет business continuity framework.
Solutions Architect
Обязателен

Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance.

Сообщество

👁 Следить ✏️ Предложить изменение

Загрузка комментариев...