Профиль навыка

Apache Airflow

DAGs, operators, sensors, XComs, dynamic task mapping, KubernetesPodOperator

Data Engineering Оркестрация данных

Ролей

4

где встречается этот навык

Грейдов

5

сформированная дорожка роста

Обязательных требований

20

ещё 0 — необязательные

Домен

Data Engineering

Группа

Оркестрация данных

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль Обязательность Описание
Analytics Engineer Обязателен Понимает базовые концепции Airflow: DAG, операторы и зависимости задач. Использует готовые шаблоны DAG для построения простых пайплайнов трансформации. Применяет паттерны интеграции dbt + Airflow, определённые командой.
BI Analyst Обязателен Понимает базовую структуру DAG Airflow и концепции планирования. Отслеживает пайплайны обновления отчётов и выявляет сбои. Следует инструкциям команды для запуска обновлений данных дашбордов через UI Airflow.
Data Analyst Обязателен Понимает базовые концепции Airflow и планирование DAG. Отслеживает запуски пайплайнов, наполняющих аналитические датасеты. Следует документации команды для запуска ad-hoc DAG для обновления и извлечения данных.
Data Engineer Обязателен Создаёт Airflow DAGs: PythonOperator, BashOperator, task dependencies. Понимает execution date, catchup, schedule interval. Мониторит runs в Airflow UI. Дебажит failed tasks через логи.
Роль Обязательность Описание
Analytics Engineer Обязателен Самостоятельно строит DAG Airflow для ELT-пайплайнов с dbt-операторами и проверками качества данных. Настраивает политики повторов, SLA и алертинг для задач трансформации. Оптимизирует параллелизм задач и пулы ресурсов.
BI Analyst Обязателен Самостоятельно настраивает DAG Airflow для генерации отчётов и обновления данных дашбордов. Реализует сенсоры качества данных для валидации источников перед обновлением BI-слоя. Устраняет сбои пайплайнов, влияющие на отчётность.
Data Analyst Обязателен Самостоятельно строит DAG Airflow для автоматической выгрузки данных и подготовки когорт. Реализует задачи валидации данных с интеграцией Great Expectations. Настраивает расписание для периодического обновления аналитических данных.
Data Engineer Обязателен Проектирует Airflow DAGs: dynamic task generation, XCom для передачи данных, TaskGroups для организации. Использует sensors, hooks для интеграции с external systems. Настраивает connections и variables.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует data-архитектуру с Apache Airflow. Оптимизирует для big data. Внедряет data governance и quality frameworks.
BI Analyst Обязателен Проектирует архитектуру пайплайнов на Airflow для корпоративной BI-платформы. Реализует сложные графы зависимостей между источниками данных с мониторингом SLA. Менторит команду по паттернам проектирования DAG для отчётных процессов.
Data Analyst Обязателен Проектирует архитектуру пайплайнов Airflow для сложных аналитических workflow с кросс-датасетными зависимостями. Внедряет отслеживание lineage данных и аудит-логирование. Оптимизирует производительность DAG для обработки больших аналитических данных.
Data Engineer Обязателен Проектирует Airflow-архитектуру: KubernetesExecutor для dynamic scaling, custom operators/hooks, DAG factory pattern для генерации. Оптимизирует performance: pool management, priority weight, concurrency.
Роль Обязательность Описание
Analytics Engineer Обязателен Определяет стратегию оркестрации аналитического pipeline: Airflow для координации dbt runs, sensor-ы для зависимостей от upstream данных. Внедряет стандарты DAG-дизайна: idempotency, retry policies, SLA monitoring для аналитических моделей.
BI Analyst Обязателен Определяет стратегию BI-пайплайнов и стандарты платформы Airflow. Устанавливает гайдлайны разработки DAG, практики код-ревью и процессы деплоя для команды отчётности. Координирует SLA свежести данных со стейкхолдерами.
Data Analyst Обязателен Определяет стратегию аналитических пайплайнов и стандарты управления Airflow. Устанавливает конвенции именования DAG, требования к тестированию и практики мониторинга. Продвигает self-service создание пайплайнов среди аналитических команд.
Data Engineer Обязателен Определяет Airflow-стандарты: DAG structure, naming conventions, testing requirements, deployment workflow. Выбирает между Airflow и альтернативами (Dagster, Prefect) по сценарию.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует оркестрацию аналитической платформы предприятия: Airflow/Dagster для multi-project dbt, event-driven triggers, cross-team dependency management. Определяет стратегию миграции на managed orchestration (dbt Cloud, Dagster Cloud).
BI Analyst Обязателен Определяет стратегию оркестрации данных на уровне организации, охватывающую Airflow, dbt и BI-инструменты. Оценивает платформы оркестрации и пути миграции. Формирует организационные стандарты доставки данных и управление кросс-командными пайплайнами.
Data Analyst Обязателен Определяет стратегию оркестрации аналитических данных на уровне организации. Формирует стандарты надёжности пайплайнов и гарантий доставки данных. Оценивает оркестрационные инструменты нового поколения и принимает решения по эволюции платформы.
Data Engineer Обязателен Проектирует orchestration-стратегию: Airflow для batch, event-driven для real-time, hybrid patterns. Определяет multi-team governance, shared infrastructure, cost allocation.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для Apache Airflow
Загрузка комментариев...