Домен
Базы данных
Профиль навыка
ClickHouse: колоночное хранение, MergeTree, materialized views, distributed
Ролей
7
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
31
ещё 4 — необязательные
Базы данных
NoSQL базы данных
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Выполняет базовые аналитические запросы к ClickHouse: агрегации, фильтрация по временным диапазонам, простые GROUP BY. Понимает колоночное хранение и его преимущества для аналитических задач. Использует HTTP-интерфейс или клиент. |
| Backend Developer (Go) | Обязателен | Выполняет базовые аналитические запросы к ClickHouse из Go через clickhouse-go драйвер. Понимает колоночную модель хранения, использует простые SELECT с агрегациями и фильтрацией по партиционированным столбцам для эффективных выборок. |
| BI Analyst | Обязателен | Пишет базовые SELECT-запросы в ClickHouse для получения данных для BI-отчётов. Понимает концепцию колоночного хранения и причины эффективности ClickHouse для аналитических нагрузок. Подключает BI-инструменты (Superset, Grafana) к источникам данных ClickHouse и строит простые дашборды на основе подготовленных таблиц. |
| Data Analyst | Обязателен | Выполняет аналитические SELECT-запросы в ClickHouse с фильтрацией, сортировкой и базовыми агрегациями. Понимает отличия ClickHouse от строковых СУБД для аналитических задач. Выполняет простые когортные запросы с использованием функций дат и GROUP BY для анализа поведения пользователей во времени. |
| Data Engineer | Обязателен | Пишет аналитические запросы в ClickHouse: SELECT с GROUP BY, ORDER BY, LIMIT. Понимает MergeTree engine и партиционирование. Вставляет данные через INSERT и использует tabular форматы. |
| Data Scientist | Запрашивает данные из ClickHouse через Python (clickhouse-driver, clickhouse-connect) для извлечения датасетов для ML-экспериментов. Преобразует результаты запросов в pandas DataFrame для разведочного анализа данных. Пишет базовые запросы выборки с использованием SAMPLE или ORDER BY rand() для создания репрезентативных обучающих подмножеств из больших таблиц. | |
| Database Engineer / DBA | Выполняет аналитические запросы в ClickHouse: SELECT с GROUP BY, фильтрация по datetime, базовые агрегации. Понимает колоночное хранение и MergeTree engine. Загружает данные из CSV и через INSERT. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Пишет сложные аналитические запросы с использованием ClickHouse-специфичных функций: arrayJoin, windowFunnel, retention. Оптимизирует запросы через правильный выбор ORDER BY ключа и использование PREWHERE для фильтрации. |
| Backend Developer (Go) | Обязателен | Самостоятельно проектирует схемы и оптимизирует запросы с ClickHouse. Понимает индексирование и планы выполнения запросов. Использует sqlx/GORM эффективно. |
| BI Analyst | Обязателен | Проектирует материализованные представления в ClickHouse для предварительной агрегации метрик и ускорения дашбордов. Использует движки AggregatingMergeTree и SummingMergeTree для поддержания агрегатов в реальном времени. Пишет сложные запросы с GROUP BY, HAVING и вложенными подзапросами для интерактивных BI-отчётов с субсекундным временем отклика. |
| Data Analyst | Обязателен | Пишет продвинутые аналитические запросы с оконными функциями (ROW_NUMBER, LAG, LEAD, накопительные итоги) для анализа трендов и ранжирования. Применяет приближённые алгоритмы ClickHouse (uniqHLL12, quantileTDigest) для быстрых оценок на больших наборах данных. Строит когортные анализы удержания в масштабе, используя массивы и функции высшего порядка. |
| Data Engineer | Обязателен | Проектирует таблицы ClickHouse для аналитических pipeline-ов: выбор engine (MergeTree, AggregatingMergeTree, ReplacingMergeTree), partitioning by date, materialized views для pre-aggregation. Оптимизирует вставку через batch inserts. |
| Data Scientist | Строит пайплайны извлечения признаков в ClickHouse с использованием агрегатных функций, оконных вычислений и операций с массивами для генерации ML-признаков в масштабе. Реализует эффективные стратегии стратифицированной выборки для подготовки обучающих данных на таблицах с миллиардами строк. Интегрирует ClickHouse с паттернами feature store, материализуя вычисленные признаки для повторного использования в нескольких ML-моделях. | |
| Database Engineer / DBA | Администрирует ClickHouse: настройка MergeTree partitioning, TTL для retention, materialized views для агрегации. Оптимизирует запросы через EXPLAIN PIPELINE. Настраивает мониторинг system-таблиц. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует аналитические таблицы в ClickHouse: выбор движков (MergeTree, AggregatingMergeTree), partition key для time-series данных. Настраивает материализованные представления для real-time агрегаций метрик. |
| Backend Developer (Go) | Обязателен | Интегрирует ClickHouse в Go-сервисы для аналитических задач: batch-вставки через clickhouse-go с буферизацией, материализованные представления, настройка партиционирования по дате. Оптимизирует запросы с учётом MergeTree-движков и колоночного хранения. |
| BI Analyst | Обязателен | Проектирует схемы ClickHouse, оптимизированные для BI-нагрузок, подбирая подходящие движки семейства MergeTree и стратегии партиционирования. Строит каскадные пайплайны материализованных представлений для многоуровневой агрегации. Оптимизирует производительность запросов через проекции, skip-индексы и словарные справочники измерений для дашбордов корпоративного масштаба. |
| Data Analyst | Обязателен | Проектирует оптимальные схемы таблиц и стратегии запросов для сложных аналитических нагрузок в ClickHouse. Владеет продвинутыми оконными функциями с пользовательскими фреймами для сложного анализа временных рядов. Реализует эффективные пайплайны когортного анализа на больших масштабах, используя материализованные представления, проекции и bitmap-функции для таблиц с миллиардами строк. |
| Data Engineer | Обязателен | Проектирует ClickHouse-архитектуру для data warehouse: distributed таблицы, sharding strategy, dictionary tables для joins. Оптимизирует запросы: projection, skip indexes, query pipeline tuning. Настраивает Kafka engine для streaming ingestion. |
| Data Scientist | Обязателен | Проектирует сквозные ML-пайплайны признаков на ClickHouse, оптимизируя извлечение данных для обучения и инференса. Использует встроенные ML-функции и статистические агрегаты ClickHouse для вычисления признаков внутри базы данных на петабайтных масштабах. Проектирует эффективные паттерны доступа к данным, минимизирующие потребление памяти при подаче больших датасетов в распределённые фреймворки обучения через чанковую итерацию. |
| Database Engineer / DBA | Обязателен | Проектирует ClickHouse-кластер: ReplicatedMergeTree, distributed таблицы, шардирование. Оптимизирует schema design для DBA-аналитики: query logs, slow query analysis, performance trends. Настраивает backup и disaster recovery. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Определяет стратегию использования ClickHouse в аналитической платформе: как движок для real-time дашбордов, integration с dbt через ClickHouse-adapter. Внедряет стандарты моделирования и TTL-политики для управления хранением. |
| Backend Developer (Go) | Обязателен | Проектирует аналитическую архитектуру на ClickHouse для Go-платформы: ETL-пайплайны из Kafka в ClickHouse, стратегии денормализации, мониторинг query performance. Стандартизирует Go-библиотеки для работы с ClickHouse и определяет паттерны batch-загрузки. |
| BI Analyst | Обязателен | Определяет архитектурные стандарты ClickHouse для BI-платформы, включая топологию кластера, политики репликации и стратегии хранения данных. Устанавливает правила управления жизненным циклом материализованных представлений и эволюцией схем. Менторит аналитиков по паттернам оптимизации запросов и координирует обновления ClickHouse с минимальным простоем дашбордов. |
| Data Analyst | Обязателен | Устанавливает стандарты и лучшие практики запросов ClickHouse для аналитической команды, включая соглашения об именовании и рекомендации по производительности. Ревьюит сложные аналитические запросы и менторит аналитиков по оптимизации оконных функций и выбору приближённых алгоритмов. Координирует решения по моделированию данных, балансируя гибкость запросов с эффективностью хранения. |
| Data Engineer | Обязателен | Определяет ClickHouse-стандарты: schema design guidelines, naming conventions, monitoring через system tables. Выбирает ClickHouse vs другие OLAP (Druid, Pinot, DuckDB) по сценарию использования. |
| Data Scientist | Обязателен | Определяет стратегию работы с данными на уровне продукта. Формирует стандарты ClickHouse. Проводит review схем данных и стратегий масштабирования. |
| Database Engineer / DBA | Обязателен | Определяет ClickHouse-стандарты: naming conventions, partitioning strategy, retention policies. Координирует использование ClickHouse для централизованного хранения database metrics, audit logs, query analytics. |
| Роль | Обязательность | Описание |
|---|---|---|
| Analytics Engineer | Обязателен | Проектирует архитектуру real-time аналитики на ClickHouse: кластерная конфигурация, репликация, distributed-таблицы для масштабирования. Определяет когда использовать ClickHouse vs warehouse (Snowflake/BigQuery) для разных аналитических задач. |
| Backend Developer (Go) | Обязателен | Определяет стратегию аналитического хранилища на ClickHouse для организации: кластерная конфигурация, политики retention и tiered storage, интеграция с Go-сервисами через общие SDK. Разрабатывает стандарты моделирования данных для OLAP-сценариев. |
| BI Analyst | Обязателен | Формирует стратегию внедрения ClickHouse для BI-аналитики на уровне организации, оценивая компромиссы по сравнению с Druid или BigQuery. Проектирует мультитенантные архитектуры ClickHouse с изоляцией ресурсов и атрибуцией затрат. Определяет техническую дорожную карту для real-time BI, интегрируя ClickHouse с потоковыми платформами и семантическими слоями. |
| Data Analyst | Обязателен | Определяет архитектуру аналитических данных организации на ClickHouse, интегрируя его в общую платформу данных наряду с потоковыми и пакетными системами. Оценивает возможности ClickHouse относительно меняющихся аналитических потребностей и продвигает внедрение новых функций (lightweight deletes, обновляемые материализованные представления). Формирует стратегию найма и обучения с фокусом на экспертизу аналитики в ClickHouse. |
| Data Engineer | Обязателен | Проектирует OLAP-стратегию платформы: ClickHouse cluster topology, cross-DC replication, capacity planning. Определяет когда ClickHouse vs Snowflake/BigQuery. Планирует data serving layer архитектуру. |
| Data Scientist | Обязателен | Определяет стратегическую роль ClickHouse в ML-платформе, проектируя слои вычисления и сервинга признаков для поддержки real-time и пакетного инференса. Обеспечивает кросс-командное согласование стандартов feature engineering между дата-сайентистами и дата-инженерами с использованием ClickHouse как вычислительного ядра. Оценивает новые возможности ClickHouse для ML-нагрузок и формирует инвестиционную стратегию организации в аналитическую инфраструктуру. |
| Database Engineer / DBA | Обязателен | Формирует стратегию аналитической платформы: ClickHouse vs TimescaleDB vs InfluxDB для database observability. Проектирует архитектуру real-time analytics для мониторинга всего fleet-а баз данных организации. |