Профиль навыка

Архитектура Data Lake

Medallion-архитектура, зоны данных, партиционирование, compaction, организация хранилища

Data Engineering Data Lakehouse

Ролей

2

где встречается этот навык

Грейдов

5

сформированная дорожка роста

Обязательных требований

10

ещё 0 — необязательные

Домен

Data Engineering

Группа

Data Lakehouse

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль Обязательность Описание
Analytics Engineer Обязателен Понимает зонную архитектуру data lake (raw, curated, consumption). Выполняет запросы из курируемых слоёв с помощью SQL и dbt-моделей. Следует командным конвенциям по партиционированию, форматам файлов и стандартам именования.
Data Engineer Обязателен Понимает принципы медальонной архитектуры (bronze/silver/gold). Загружает данные в raw-зоны с помощью пакетных загрузчиков и реестров схем. Следует установленным паттернам для размещения Parquet/ORC файлов и метаданных каталога.
Роль Обязательность Описание
Analytics Engineer Обязателен Самостоятельно строит аналитические data-продукты поверх слоёв data lake с использованием dbt и Spark SQL. Оптимизирует производительность запросов через интеллектуальное партиционирование и Z-ordering. Обеспечивает качество данных проверками Great Expectations на границах зон.
Data Engineer Обязателен Самостоятельно проектирует ETL-пайплайны между зонами data lake с поддержкой эволюции схем. Оптимизирует стоимость хранения через lifecycle-политики, компактификацию и многоуровневое хранение. Реализует контроль качества данных между слоями медальонной архитектуры с автоматизированной валидацией.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует data-архитектуру с Архитектура Data Lake. Оптимизирует для big data. Внедряет data governance и quality frameworks.
Data Engineer Обязателен Проектирует data-архитектуру с Архитектура Data Lake. Оптимизирует для big data. Внедряет data governance и quality frameworks.
Роль Обязательность Описание
Analytics Engineer Обязателен Определяет архитектуру data lake для аналитической платформы: medallion-подход (bronze/silver/gold), выбор форматов хранения (Parquet, Delta, Iceberg). Внедряет стандарты партиционирования и retention для оптимизации стоимости.
Data Engineer Обязателен Определяет data lake стандарты: zone architecture (bronze/silver/gold), file formats, partition strategies. Внедряет access control и data classification. Координирует между data producers и consumers.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует lakehouse-архитектуру предприятия: Delta Lake/Iceberg как open table format, integration с dbt для трансформаций, unified governance. Определяет стратегию совмещения data lake и warehouse для разных аналитических workloads.
Data Engineer Обязателен Проектирует data lakehouse архитектуру: unified storage layer, query engine federation (Trino/Spark), governance framework. Определяет когда lakehouse vs traditional DWH vs data mesh.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для Архитектура Data Lake
Загрузка комментариев...