Домен
Архитектура и проектирование
Профиль навыка
RPO/RTO, мультирегиональность, failover-стратегии, бэкапы, планы восстановления
Ролей
9
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
24
ещё 18 — необязательные
Архитектура и проектирование
System Design
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Cloud Engineer | Понимает базовые концепции аварийного восстановления для облака: стратегии бэкапов, RPO/RTO и зоны доступности. Следует командным процедурам выполнения DR-runbook'ов и проверки целостности бэкапов. | |
| Database Engineer / DBA | Понимает базовые архитектурные концепции Disaster Recovery Design. Следует архитектурным решениям команды. Понимает основные паттерны. | |
| DevOps Engineer | Понимает концепции DR: RPO, RTO, backup/restore, hot/warm/cold standby. Выполняет бэкапирование по расписанию, проверяет целостность бэкапов по инструкции. Знает основные риски и сценарии сбоев в облачной инфраструктуре. | |
| Infrastructure Engineer | Понимает базовые концепции аварийного восстановления: типы бэкапов (полный, инкрементальный, дифференциальный), процедуры восстановления и основы failover. Следует гайдлайнам команды по верификации бэкапов, тестированию restore и проверкам аппаратной избыточности. | |
| Network Engineer | Знает базовые концепции disaster recovery для network engineer и умеет применять их в типовых задачах. Использует стандартные инструменты и следует установленным практикам команды. Понимает когда и почему применяется данный подход. | |
| Platform Engineer | Понимает RPO/RTO метрики для платформенных сервисов. Участвует в DR-drills по runbooks: проверяет работоспособность backup-ов, тестирует restore процедуры. Настраивает базовые backup-политики (Velero для K8s, AWS Backup). Документирует результаты DR-тестирования | |
| Site Reliability Engineer (SRE) | Понимает DR-концепции: RPO, RTO, backup types. Следует DR-процедурам: failover runbooks, backup verification. Участвует в DR-drills. |
| Роль | Обязательность | Описание |
|---|---|---|
| Cloud Engineer | Применяет проектирование DR для облачных нагрузок: multi-AZ деплои, кросс-региональная репликация, автоматический failover через Route 53/Traffic Manager. Реализует автоматизацию бэкапов с lifecycle policies и проводит регулярные DR-учения. | |
| Database Engineer / DBA | Участвует в DR-процессах: выполняет backup verification, тестирует restore procedures по runbooks. Настраивает automated snapshots и cross-region backup копирование. Мониторит replication lag и backup status. | |
| DevOps Engineer | Реализует DR-решения: автоматизированные бэкапы (Velero для Kubernetes, AWS Backup), репликация данных между регионами. Настраивает automated failover для баз данных, тестирует restore-процедуры. Документирует DR-планы и runbooks. | |
| Engineering Manager | Применяет DR-планирование в оценках рисков проектов и обсуждениях бизнес-непрерывности. Понимает компромиссы между стоимостью DR и возможностями восстановления. Координирует участие команды в DR-учениях и упражнениях по реагированию на инциденты. | |
| Infrastructure Engineer | Применяет проектирование DR для on-premise и гибридной инфраструктуры: конфигурации RAID, репликация SAN, warm/hot standby серверы. Реализует автоматизированные расписания бэкапов и проводит ежеквартальное DR-тестирование с документированными процедурами восстановления. | |
| Network Engineer | Уверенно применяет disaster recovery для network engineer при решении нестандартных задач. Самостоятельно выбирает оптимальный подход и инструменты. Анализирует trade-offs и предлагает улучшения существующих решений. | |
| Platform Engineer | Настраивает DR-инфраструктуру платформы: Velero backup schedules, cross-region S3 replication, database replicas. Создаёт automated DR runbooks для ключевых сервисов. Проводит quarterly DR-drills и анализирует gaps. Настраивает monitoring для RPO compliance | |
| Site Reliability Engineer (SRE) | Реализует DR-решения: automated backups, cross-region replication, failover testing. Документирует DR-планы. Настраивает backup monitoring и alerting на backup failures. |
| Роль | Обязательность | Описание |
|---|---|---|
| Cloud Engineer | Обязателен | Проектирует DR-архитектуру для мультиоблачных сред: pilot light, warm standby и multi-site active-active паттерны. Внедряет chaos engineering для валидации DR. Принимает ADR-решения по компромиссам RPO/RTO и оптимизации стоимости устойчивости. |
| Database Engineer / DBA | Обязателен | Проектирует DR для database tier: multi-region replication, automated failover (Patroni, MHA), backup verification through automated restores. Определяет RPO/RTO для разных tier-ов. Проводит DR drills. |
| DevOps Engineer | Обязателен | Проектирует DR-архитектуру: multi-region active-passive и active-active конфигурации, автоматический failover с DNS. Внедряет chaos engineering (Chaos Monkey, Litmus) для валидации DR. Определяет RPO/RTO для каждого сервиса, автоматизирует DR-тестирование. |
| Engineering Manager | Обязателен | Проектирует DR-процессы в соответствии с требованиями бизнес-непрерывности и compliance. Оценивает ROI инвестиций в DR и согласовывает целевые RPO/RTO со стейкхолдерами. Устанавливает регулярный каданс DR-тестирования и практики post-mortem ревью. |
| Infrastructure Engineer | Обязателен | Проектирует disaster recovery для критической инфраструктуры: multi-AZ архитектура с автоматическим failover, бэкап стратегия с cross-region репликацией, runbook-и для восстановления. Настраивает автоматическое тестирование DR через chaos engineering (Chaos Monkey, Litmus), определяет RPO/RTO для каждого компонента. |
| Network Engineer | Экспертно применяет disaster recovery для network engineer для проектирования сложных систем. Оптимизирует существующие решения и предотвращает архитектурные ошибки. Проводит code review и обучает коллег лучшим практикам. | |
| Platform Engineer | Обязателен | Проектирует DR-архитектуру для IDP: multi-region active-passive, pilot light, warm standby для платформенных компонентов. Внедряет chaos engineering (Litmus, Gremlin) для валидации DR-планов. Создаёт automated failover с DNS-based switching и health-check driven promotion |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует DR-архитектуру: active-passive vs active-active, pilot light, warm standby. Реализует automated failover. Проводит chaos engineering для DR validation. Определяет RTO/RPO по tier-ам. |
| Solutions Architect | Обязателен | Проектирует корпоративную DR-архитектуру с мультирегиональным failover, стратегиями репликации данных и автоматической оркестрацией восстановления. Оценивает нефункциональные требования к устойчивости. Принимает ADR-решения по паттернам active-passive vs active-active. |
| Роль | Обязательность | Описание |
|---|---|---|
| Cloud Engineer | Обязателен | Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review. |
| Database Engineer / DBA | Обязателен | Определяет DR-стандарты для data-платформы: RPO/RTO по tier-ам, DR testing schedule, failover procedures. Координирует DR drills с cross-functional командами. Формирует incident playbooks для database failures. |
| DevOps Engineer | Обязателен | Определяет DR-стратегию организации: классификация сервисов по критичности, стандарты RPO/RTO для каждого tier. Проектирует платформу автоматизированного DR-тестирования, процессы game days и tabletop exercises. Управляет DR-бюджетом и приоритизацией. |
| Engineering Manager | Обязателен | Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review. |
| Infrastructure Engineer | Обязателен | Определяет DR-стандарты для инфраструктуры организации: классификация сервисов по критичности (Tier 1-4), стандартные DR-паттерны для каждого tier-а, регулярные DR-drill-ы. Ревьюит DR-планы команд, внедряет automated failover testing и координирует ежеквартальные учения по восстановлению после сбоев. |
| Network Engineer | Устанавливает стандарты применения disaster recovery для network engineer в команде и принимает архитектурные решения. Определяет технический roadmap с учётом данного навыка. Менторит senior инженеров и влияет на практики смежных команд. | |
| Platform Engineer | Обязателен | Определяет DR-стратегию организации: tiered RPO/RTO по критичности сервисов, budget allocation, compliance requirements. Руководит проведением game days и tabletop exercises для DR-планов. Проектирует organizational DR governance с регулярным review и improvement циклом |
| Site Reliability Engineer (SRE) | Обязателен | Определяет DR-стандарты организации: tiered recovery model, mandatory DR-testing schedule, communication plan. Координирует cross-team DR drills. Внедряет DR metrics. |
| Solutions Architect | Обязателен | Определяет архитектурную стратегию продукта с Disaster Recovery Design. Формирует architecture guidelines. Проводит architecture review. |
| Роль | Обязательность | Описание |
|---|---|---|
| Cloud Engineer | Обязателен | Формирует DR-стратегию на уровне организации: multi-region active-active vs pilot light vs warm standby, RPO/RTO матрица по criticality. Проектирует автоматизированный failover через Route 53 health checks и cross-region replication. Организует регулярные DR-учения и gameday exercises. |
| Database Engineer / DBA | Обязателен | Формирует disaster recovery стратегию организации: multi-region active-active vs active-passive, cross-cloud DR, RTO/RPO frameworks. Определяет DR governance, compliance requirements, и инвестиции в database resilience. |
| DevOps Engineer | Обязателен | Разрабатывает корпоративную стратегию business continuity и disaster recovery: мульти-облачный DR, автоматизированный failover для всей платформы. Определяет архитектуру resilience engineering: chaos engineering culture, gameday framework, continuous DR validation. |
| Engineering Manager | Обязателен | Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance. |
| Infrastructure Engineer | Обязателен | Формирует стратегию Business Continuity и Disaster Recovery для компании: архитектура active-active multi-region, DR для мульти-облачных сред, compliance с regulatory DR requirements. Определяет инвестиции в DR-инфраструктуру, проектирует сценарии полной потери региона и координирует DR-стратегию с руководством компании. |
| Network Engineer | Формирует стратегию применения disaster recovery для network engineer на уровне организации. Определяет best practices и влияет на выбор технологий за пределами своей команды. Является признанным экспертом в данной области. | |
| Platform Engineer | Обязателен | Формирует стратегию business continuity для платформы: active-active multi-region, cell-based architecture для blast radius isolation. Определяет архитектурные паттерны для resilient distributed systems. Консультирует board по risk management и compliance для mission-critical платформы |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует organizational DR стратегию: multi-region architecture, data sovereignty compliance, full-stack failover automation. Определяет business continuity framework. |
| Solutions Architect | Обязателен | Определяет архитектурную стратегию организации. Проектирует reference architectures. Формирует architecture governance. |