Домен
Data Engineering
Профиль навыка
DAGs, operators, sensors, XComs, dynamic task mapping, KubernetesPodOperator
Ролей
4
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
20
ещё 0 — необязательные
Data Engineering
Оркестрация данных
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Понимает базовые концепции Airflow: DAG, операторы и зависимости задач. Использует готовые шаблоны DAG для построения простых пайплайнов трансформации. Применяет паттерны интеграции dbt + Airflow, определённые командой. |
| BI Analyst | Обязателен | Понимает базовую структуру DAG Airflow и концепции планирования. Отслеживает пайплайны обновления отчётов и выявляет сбои. Следует инструкциям команды для запуска обновлений данных дашбордов через UI Airflow. |
| Data Analyst | Обязателен | Понимает базовые концепции Airflow и планирование DAG. Отслеживает запуски пайплайнов, наполняющих аналитические датасеты. Следует документации команды для запуска ad-hoc DAG для обновления и извлечения данных. |
| Data Engineer | Обязателен | Создаёт Airflow DAGs: PythonOperator, BashOperator, task dependencies. Понимает execution date, catchup, schedule interval. Мониторит runs в Airflow UI. Дебажит failed tasks через логи. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Самостоятельно строит DAG Airflow для ELT-пайплайнов с dbt-операторами и проверками качества данных. Настраивает политики повторов, SLA и алертинг для задач трансформации. Оптимизирует параллелизм задач и пулы ресурсов. |
| BI Analyst | Обязателен | Самостоятельно настраивает DAG Airflow для генерации отчётов и обновления данных дашбордов. Реализует сенсоры качества данных для валидации источников перед обновлением BI-слоя. Устраняет сбои пайплайнов, влияющие на отчётность. |
| Data Analyst | Обязателен | Самостоятельно строит DAG Airflow для автоматической выгрузки данных и подготовки когорт. Реализует задачи валидации данных с интеграцией Great Expectations. Настраивает расписание для периодического обновления аналитических данных. |
| Data Engineer | Обязателен | Проектирует Airflow DAGs: dynamic task generation, XCom для передачи данных, TaskGroups для организации. Использует sensors, hooks для интеграции с external systems. Настраивает connections и variables. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует data-архитектуру с Apache Airflow. Оптимизирует для big data. Внедряет data governance и quality frameworks. |
| BI Analyst | Обязателен | Проектирует архитектуру пайплайнов на Airflow для корпоративной BI-платформы. Реализует сложные графы зависимостей между источниками данных с мониторингом SLA. Менторит команду по паттернам проектирования DAG для отчётных процессов. |
| Data Analyst | Обязателен | Проектирует архитектуру пайплайнов Airflow для сложных аналитических workflow с кросс-датасетными зависимостями. Внедряет отслеживание lineage данных и аудит-логирование. Оптимизирует производительность DAG для обработки больших аналитических данных. |
| Data Engineer | Обязателен | Проектирует Airflow-архитектуру: KubernetesExecutor для dynamic scaling, custom operators/hooks, DAG factory pattern для генерации. Оптимизирует performance: pool management, priority weight, concurrency. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Определяет стратегию оркестрации аналитического pipeline: Airflow для координации dbt runs, sensor-ы для зависимостей от upstream данных. Внедряет стандарты DAG-дизайна: idempotency, retry policies, SLA monitoring для аналитических моделей. |
| BI Analyst | Обязателен | Определяет стратегию BI-пайплайнов и стандарты платформы Airflow. Устанавливает гайдлайны разработки DAG, практики код-ревью и процессы деплоя для команды отчётности. Координирует SLA свежести данных со стейкхолдерами. |
| Data Analyst | Обязателен | Определяет стратегию аналитических пайплайнов и стандарты управления Airflow. Устанавливает конвенции именования DAG, требования к тестированию и практики мониторинга. Продвигает self-service создание пайплайнов среди аналитических команд. |
| Data Engineer | Обязателен | Определяет Airflow-стандарты: DAG structure, naming conventions, testing requirements, deployment workflow. Выбирает между Airflow и альтернативами (Dagster, Prefect) по сценарию. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует оркестрацию аналитической платформы предприятия: Airflow/Dagster для multi-project dbt, event-driven triggers, cross-team dependency management. Определяет стратегию миграции на managed orchestration (dbt Cloud, Dagster Cloud). |
| BI Analyst | Обязателен | Определяет стратегию оркестрации данных на уровне организации, охватывающую Airflow, dbt и BI-инструменты. Оценивает платформы оркестрации и пути миграции. Формирует организационные стандарты доставки данных и управление кросс-командными пайплайнами. |
| Data Analyst | Обязателен | Определяет стратегию оркестрации аналитических данных на уровне организации. Формирует стандарты надёжности пайплайнов и гарантий доставки данных. Оценивает оркестрационные инструменты нового поколения и принимает решения по эволюции платформы. |
| Data Engineer | Обязателен | Проектирует orchestration-стратегию: Airflow для batch, event-driven для real-time, hybrid patterns. Определяет multi-team governance, shared infrastructure, cost allocation. |