Домен
Observability и мониторинг
Профиль навыка
New Relic, Elastic APM, Datadog APM, трассировка транзакций, bottleneck-анализ
Ролей
2
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
6
ещё 4 — необязательные
Observability и мониторинг
Профилирование
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Performance Testing Engineer | Использует APM-инструменты (New Relic, Datadog) для мониторинга тестовых сред. Читает предварительно настроенные дашборды для выявления регрессий производительности. Соотносит метрики APM с результатами нагрузочного тестирования под руководством старших коллег. | |
| Site Reliability Engineer (SRE) | Работает с APM-дашбордами для проверки состояния сервисов и уровня ошибок. Понимает базовые метрики: задержку, пропускную способность, процент ошибок. Эскалирует аномалии, обнаруженные через APM-алерты, старшим инженерам. |
| Роль | Обязательность | Описание |
|---|---|---|
| Performance Testing Engineer | Настраивает APM-агенты для инструментирования сервисов во время нагрузочных тестов. Строит кастомные дашборды, коррелирующие паттерны нагрузки с метриками приложения. Настраивает пороги алертов на основе SLA производительности и базовых измерений. | |
| Site Reliability Engineer (SRE) | Настраивает APM-инструментирование в микросервисах для продакшн-мониторинга. Создаёт дашборды для отслеживания golden signals и соответствия SLI. Участвует в дежурствах, используя данные APM для триажа и разрешения инцидентов. |
| Роль | Обязательность | Описание |
|---|---|---|
| Performance Testing Engineer | Обязателен | Проектирует сквозную APM-стратегию для пайплайнов нагрузочного тестирования. Внедряет распределённую трассировку для выявления узких мест на границах сервисов. Определяет фреймворки SLI/SLO для производительности и ведёт аналитические ревью по итогам тестов. |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует платформу наблюдаемости, интегрирующую APM, логирование и трассировку. Определяет SLI/SLO для критичных сервисов и автоматизирует отслеживание error budget. Ведёт процессы post-mortem и инициирует улучшения надёжности на основе данных APM. |
| Роль | Обязательность | Описание |
|---|---|---|
| Performance Testing Engineer | Обязателен | Определяет APM strategy для performance: tool selection (Datadog/New Relic/Dynatrace), integration с load testing, automated bottleneck detection. Внедряет APM для continuous performance. |
| Site Reliability Engineer (SRE) | Обязателен | Определяет APM-стратегию: Datadog vs New Relic vs open-source (OTel + backends), feature comparison, cost analysis. Внедряет APM для critical services. Определяет instrumentation requirements. |
| Роль | Обязательность | Описание |
|---|---|---|
| Performance Testing Engineer | Обязателен | Проектирует APM platform для performance engineering: unified application monitoring, automated performance analysis, capacity prediction. Определяет tool evaluation criteria. |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует APM-платформу: unified APM для всех сервисов, custom dashboards, automated alerting. Определяет vendor selection criteria, negotiation strategy, multi-year roadmap. |