Выберите текущую позицию

Укажите роль и уровень — система покажет путь развития, навыки и gap-анализ.

Путь развития

Junior

0-2 года

Текущий

Ответственность: Выполнение задач под руководством старших коллег. Изучение кодовой базы, стандартов и процессов команды. Написание кода по спецификациям, исправление простых багов, написание тестов.

Ключевые навыки:

Apache Airflow Нужно
BI-дашборды Нужно
ClickHouse Нужно
Data Catalog Нужно
Data Contracts Нужно
Data Lineage Нужно
Data Quality Нужно
Data Warehouse Design Нужно
dbt Нужно
MySQL / MariaDB Нужно
Pandas / Polars Нужно
PostgreSQL Нужно
SQL-based ETL Нужно
Индексирование БД Нужно
Оптимизация запросов Нужно
Проектирование схем данных Нужно

Middle

2-5 лет

Следующий

Ответственность: Самостоятельная разработка фич от декомпозиции до деплоя. Участие в code review. Оптимизация производительности. Менторинг junior-разработчиков. Участие в архитектурных обсуждениях.

Ключевые навыки:

Apache Airflow Нужно
BI-дашборды Нужно
ClickHouse Нужно
Data Catalog Нужно
Data Contracts Нужно
Data Lineage Нужно
Data Quality Нужно
Data Warehouse Design Нужно
dbt Нужно
MySQL / MariaDB Нужно
Pandas / Polars Нужно
PostgreSQL Нужно
SQL-based ETL Нужно
Индексирование БД Нужно
Оптимизация запросов Нужно
Проектирование схем данных Нужно
Переход: ~2-3 года
  • Самостоятельно реализовал 3+ проекта
  • Провёл успешные код-ревью
  • Участвовал в разрешении production инцидентов

Senior

5-8 лет

Ответственность: Проектирование архитектуры компонентов и сервисов. Решение сложных технических проблем. Ведение технического долга. Code review как gatekeeper качества. Менторинг middle-разработчиков. Выбор технологий для новых задач.

Ключевые навыки:

Apache Airflow Нужно
AWS Нужно
BI-дашборды Нужно
ChatGPT / Claude Нужно
ClickHouse Нужно
Code Review Нужно
Data Catalog Нужно
Data Contracts Нужно
Data Lineage Нужно
Data Quality Нужно
Data Warehouse Design Нужно
dbt Нужно
Docker Нужно
Elasticsearch / OpenSearch Нужно
Git Advanced Нужно
GitHub Copilot Нужно
MySQL / MariaDB Нужно
Pandas / Polars Нужно
PostgreSQL Нужно
Prometheus и Grafana Нужно
Prompt Engineering для кода Нужно
Python Web Frameworks Нужно
REST API Design Нужно
SQL-based ETL Нужно
Бизнес-метрики Нужно
Документирование API Нужно
Индексирование БД Нужно
Качество кода и рефакторинг Нужно
Оптимизация запросов Нужно
Проектирование схем данных Нужно
Структурированное логирование Нужно
Структуры данных Нужно
Переход: ~2-3 года
  • Самостоятельно реализовал 3+ проекта
  • Провёл успешные код-ревью
  • Участвовал в разрешении production инцидентов

Lead / Staff

7-12 лет

Ответственность: Техническое лидерство команды или направления. Проектирование системной архитектуры. Координация с другими командами. Формирование стандартов и best practices. Участие в найме. Планирование технического roadmap.

Ключевые навыки:

Apache Airflow Нужно
AWS Нужно
BI-дашборды Нужно
ChatGPT / Claude Нужно
ClickHouse Нужно
Code Review Нужно
Data Catalog Нужно
Data Contracts Нужно
Data Lineage Нужно
Data Quality Нужно
Data Warehouse Design Нужно
dbt Нужно
Docker Нужно
Elasticsearch / OpenSearch Нужно
Git Advanced Нужно
GitHub Copilot Нужно
MySQL / MariaDB Нужно
Pandas / Polars Нужно
PostgreSQL Нужно
Prometheus и Grafana Нужно
Prompt Engineering для кода Нужно
Python Web Frameworks Нужно
REST API Design Нужно
SQL-based ETL Нужно
Бизнес-метрики Нужно
Документирование API Нужно
Индексирование БД Нужно
Качество кода и рефакторинг Нужно
Оптимизация запросов Нужно
Проектирование схем данных Нужно
Структурированное логирование Нужно
Структуры данных Нужно
Переход: ~2-3 года
  • Самостоятельно реализовал 3+ проекта
  • Провёл успешные код-ревью
  • Участвовал в разрешении production инцидентов

Principal

10+ лет

Ответственность: Техническая стратегия на уровне компании или домена. Кросс-организационное влияние. Решение системных проблем бизнеса через технологии. Менторинг lead-инженеров. Публичное представление компании.

Ключевые навыки:

Apache Airflow Нужно
AWS Нужно
BI-дашборды Нужно
ChatGPT / Claude Нужно
ClickHouse Нужно
Code Review Нужно
Data Catalog Нужно
Data Contracts Нужно
Data Lineage Нужно
Data Quality Нужно
Data Warehouse Design Нужно
dbt Нужно
Docker Нужно
Elasticsearch / OpenSearch Нужно
Git Advanced Нужно
GitHub Copilot Нужно
MySQL / MariaDB Нужно
Pandas / Polars Нужно
PostgreSQL Нужно
Prometheus и Grafana Нужно
Prompt Engineering для кода Нужно
Python Web Frameworks Нужно
REST API Design Нужно
SQL-based ETL Нужно
Бизнес-метрики Нужно
Документирование API Нужно
Индексирование БД Нужно
Качество кода и рефакторинг Нужно
Оптимизация запросов Нужно
Проектирование схем данных Нужно
Структурированное логирование Нужно
Структуры данных Нужно
Переход: ~2-3 года
  • Самостоятельно реализовал 3+ проекта
  • Провёл успешные код-ревью
  • Участвовал в разрешении production инцидентов

Gap-анализ: навыки для развития

Для перехода на следующий уровень необходимо развить:

Apache Airflow

Самостоятельно настраивает DAG Airflow для генерации отчётов и обновления данных дашбордов. Реализует сенсоры качества данных для валидации источников перед обновлением BI-слоя. Устраняет сбои пайплайнов, влияющие на отчётность.

BI-дашборды

Самостоятельно проектирует интерактивные дашборды в Tableau и Power BI с вычисляемыми полями и LOD-выражениями. Оптимизирует производительность запросов на больших данных. Реализует слои self-service BI для автономной работы бизнес-пользователей с KPI.

ClickHouse

Проектирует материализованные представления в ClickHouse для предварительной агрегации метрик и ускорения дашбордов. Использует движки AggregatingMergeTree и SummingMergeTree для поддержания агрегатов в реальном времени. Пишет сложные запросы с GROUP BY, HAVING и вложенными подзапросами для интерактивных BI-отчётов с субсекундным временем отклика.

Data Catalog

Самостоятельно управляет метаданными BI-слоя в каталоге данных. Настраивает определения метрик, иерархии KPI и маппинги дашборд-источник. Реализует индикаторы свежести данных и значки качества для отчётных датасетов.

Data Contracts

Самостоятельно управляет контрактами данных для слоя потребления BI. Определяет контракты метрик, специфицируя правила агрегации, гранулярность и SLA свежести. Реализует валидацию на основе контрактов перед публикацией дашбордов.

Data Lineage

Самостоятельно трассирует lineage данных от BI-дашбордов до систем-источников. Использует инструменты lineage для анализа влияния перед изменениями источников данных. Реализует документацию на основе lineage для прозрачности расчёта метрик.

Data Quality

Внедряет автоматические проверки качества в BI-пайплайнах через SQL и dbt tests. Настраивает мониторинг свежести данных для дашбордов Tableau/Power BI. Строит слои валидации в ClickHouse и BigQuery для отслеживания дрифта схем. Создаёт скоркарды качества и алертинг.

Data Warehouse Design

Проектирует star- и snowflake-схемы, оптимизированные для BI-отчётности. Создаёт агрегатные таблицы и материализованные представления, существенно ускоряющие запросы дашбордов. Предлагает изменения схем команде хранилища на основе требований отчётности и участвует в решениях по dimensional modeling для новых доменов данных.

dbt

Самостоятельно пишет dbt-модели для BI-слоя отчётности: определения метрик, агрегатные таблицы и размерные модели. Реализует schema tests и проверки свежести данных. Настраивает dbt exposures для документирования зависимостей downstream-дашбордов.

MySQL / MariaDB

Создаёт оптимизированные отчётные представления и материализованные сводные таблицы в MySQL для BI-дашбордов. Оптимизирует агрегирующие запросы с помощью составных индексов и планов выполнения. Настраивает live- и extract-подключения в Tableau и Power BI с корректными параметрами драйвера MySQL для надёжного обновления по расписанию.

Pandas / Polars

Реализует эффективные BI пайплайны данных с Pandas: мерж данных из множества источников, сложные цепочки агрегации и анализ временных рядов для детекции трендов. Оптимизирует использование памяти через правильный выбор dtype и чтение чанками для больших файлов. Создаёт переиспользуемые функции трансформации данных для повторяющихся аналитических задач.

PostgreSQL

Самостоятельно проектирует аналитические схемы и оптимизирует сложные запросы: пишет производительные многотабличные JOIN с оконными функциями, понимает планы выполнения запросов для оптимизации, внедряет материализованные представления для ускорения отчётов. Понимает компромиссы между нормализованными схемами и аналитической денормализацией для BI-нагрузок.

SQL-based ETL

Строит ETL-пайплайны для наполнения dimensional моделей BI-отчётности. Реализует загрузки SCD Type 1/2, управляет суррогатными ключами и обеспечивает ссылочную целостность между таблицами фактов и измерений.

Индексирование БД

Проектирует стратегии индексирования для аналитических нагрузок: покрывающие индексы для запросов дашбордов, частичные индексы для фильтрованных отчётов и columnstore-индексы для OLAP-паттернов. Понимает планы выполнения запросов и может рекомендовать изменения индексов DBA. Балансирует накладные расходы на обслуживание индексов с выигрышем производительности запросов.

Оптимизация запросов

Самостоятельно проектирует и оптимизирует аналитические запросы: оконные функции для скользящих вычислений, CTE для читаемости и переиспользования запросов и декомпозиция запросов для сложных отчётов. Анализирует планы выполнения для выбора между nested loops, hash joins и merge joins. Оптимизирует материализованные представления для производительности дашбордов.

Проектирование схем данных

Самостоятельно проектирует размерные модели для BI-отчётности. Реализует медленно меняющиеся измерения (SCD Type 1/2), согласованные измерения и агрегатные таблицы. Оптимизирует модели данных для производительности запросов дашбордов с правильной индексацией и партиционированием.