Домен
Data Engineering
Профиль навыка
Medallion-архитектура, зоны данных, партиционирование, compaction, организация хранилища
Ролей
2
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
10
ещё 0 — необязательные
Data Engineering
Data Lakehouse
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Понимает зонную архитектуру data lake (raw, curated, consumption). Выполняет запросы из курируемых слоёв с помощью SQL и dbt-моделей. Следует командным конвенциям по партиционированию, форматам файлов и стандартам именования. |
| Data Engineer | Обязателен | Понимает принципы медальонной архитектуры (bronze/silver/gold). Загружает данные в raw-зоны с помощью пакетных загрузчиков и реестров схем. Следует установленным паттернам для размещения Parquet/ORC файлов и метаданных каталога. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Самостоятельно строит аналитические data-продукты поверх слоёв data lake с использованием dbt и Spark SQL. Оптимизирует производительность запросов через интеллектуальное партиционирование и Z-ordering. Обеспечивает качество данных проверками Great Expectations на границах зон. |
| Data Engineer | Обязателен | Самостоятельно проектирует ETL-пайплайны между зонами data lake с поддержкой эволюции схем. Оптимизирует стоимость хранения через lifecycle-политики, компактификацию и многоуровневое хранение. Реализует контроль качества данных между слоями медальонной архитектуры с автоматизированной валидацией. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует data-архитектуру с Архитектура Data Lake. Оптимизирует для big data. Внедряет data governance и quality frameworks. |
| Data Engineer | Обязателен | Проектирует data-архитектуру с Архитектура Data Lake. Оптимизирует для big data. Внедряет data governance и quality frameworks. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Определяет архитектуру data lake для аналитической платформы: medallion-подход (bronze/silver/gold), выбор форматов хранения (Parquet, Delta, Iceberg). Внедряет стандарты партиционирования и retention для оптимизации стоимости. |
| Data Engineer | Обязателен | Определяет data lake стандарты: zone architecture (bronze/silver/gold), file formats, partition strategies. Внедряет access control и data classification. Координирует между data producers и consumers. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует lakehouse-архитектуру предприятия: Delta Lake/Iceberg как open table format, integration с dbt для трансформаций, unified governance. Определяет стратегию совмещения data lake и warehouse для разных аналитических workloads. |
| Data Engineer | Обязателен | Проектирует data lakehouse архитектуру: unified storage layer, query engine federation (Trino/Spark), governance framework. Определяет когда lakehouse vs traditional DWH vs data mesh. |