Домен
Observability и мониторинг
Профиль навыка
Агрегация логов, LogQL, лейблы, retention, мультитенантность, интеграция с Grafana
Ролей
2
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
6
ещё 4 — необязательные
Observability и мониторинг
Логирование
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Platform Engineer | Запрашивает логи в Grafana Loki с помощью базового синтаксиса LogQL. Навигирует по Grafana-дашбордам для просмотра потоков логов приложений. Понимает фильтрацию логов по лейблам и базовые концепции агрегации логов. | |
| Site Reliability Engineer (SRE) | Использует Grafana Loki для поиска и фильтрации логов при расследовании инцидентов. Понимает политики хранения логов и концепции хранилища. Следует ранбукам, ссылающимся на Loki-запросы, для типовых сценариев траблшутинга. |
| Роль | Обязательность | Описание |
|---|---|---|
| Platform Engineer | Настраивает пайплайны загрузки Loki с Promtail и извлечением структурированных метаданных. Строит Grafana-дашборды, комбинирующие логи Loki с метриками Prometheus для коррелированной наблюдаемости. Настраивает правила алертинга на основе логов для мониторинга здоровья платформы. | |
| Site Reliability Engineer (SRE) | Настраивает Loki для мультитенантной агрегации логов между сервисами. Создаёт продвинутые LogQL-запросы с извлечением метрик для отслеживания SLI. Строит правила алертинга по паттернам логов и участвует в дежурствах, используя лог-диагностику. |
| Роль | Обязательность | Описание |
|---|---|---|
| Platform Engineer | Обязателен | Архитектурирует топологию развёртывания Loki для высокопроизводительной мультикластерной агрегации логов. Проектирует стандарты лог-пайплайнов: соглашения по лейблам, политики хранения, оптимизацию затрат. Интегрирует Loki в стек наблюдаемости платформы наряду с трассировкой и метриками. |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует организационную стратегию логирования с Loki в качестве централизованной лог-платформы. Определяет SLI/SLO на основе метрик из логов и автоматизирует алертинг по error budget. Ведёт post-mortem, используя корреляцию Loki с распределёнными трассировками и данными APM. |
| Роль | Обязательность | Описание |
|---|---|---|
| Platform Engineer | Обязателен | Внедряет Grafana Loki как cost-effective logging решение для платформы: multi-tenant конфигурация, retention policies. Проектирует label-стратегию для оптимального query performance. Интегрирует с Grafana для unified observability (logs + metrics + traces в одном UI) |
| Site Reliability Engineer (SRE) | Обязателен | Определяет Loki-стандарты: label strategy (low cardinality), retention policies, query patterns. Внедряет Loki для cost-effective log aggregation. Сравнивает Loki vs ELK по сценариям. |
| Роль | Обязательность | Описание |
|---|---|---|
| Platform Engineer | Обязателен | Определяет стратегию logging: Loki vs ELK vs managed решения для различных use cases платформы. Проектирует Loki at scale: microservices mode, S3 backend, caching. Формирует видение cost-efficient observability data platform с разными tier-ами хранения |
| Site Reliability Engineer (SRE) | Обязателен | Проектирует log aggregation стратегию: Loki для Kubernetes-native logging, multi-tenant setup, long-term storage. Определяет когда Loki vs ELK vs managed (Datadog/Splunk). |