Профиль навыка

ClickHouse

ClickHouse: колоночное хранение, MergeTree, materialized views, distributed

Базы данных NoSQL базы данных

Ролей

7

где встречается этот навык

Грейдов

5

сформированная дорожка роста

Обязательных требований

31

ещё 4 — необязательные

Домен

Базы данных

Группа

NoSQL базы данных

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль Обязательность Описание
Analytics Engineer Обязателен Выполняет базовые аналитические запросы к ClickHouse: агрегации, фильтрация по временным диапазонам, простые GROUP BY. Понимает колоночное хранение и его преимущества для аналитических задач. Использует HTTP-интерфейс или клиент.
Backend Developer (Go) Обязателен Выполняет базовые аналитические запросы к ClickHouse из Go через clickhouse-go драйвер. Понимает колоночную модель хранения, использует простые SELECT с агрегациями и фильтрацией по партиционированным столбцам для эффективных выборок.
BI Analyst Обязателен Пишет базовые SELECT-запросы в ClickHouse для получения данных для BI-отчётов. Понимает концепцию колоночного хранения и причины эффективности ClickHouse для аналитических нагрузок. Подключает BI-инструменты (Superset, Grafana) к источникам данных ClickHouse и строит простые дашборды на основе подготовленных таблиц.
Data Analyst Обязателен Выполняет аналитические SELECT-запросы в ClickHouse с фильтрацией, сортировкой и базовыми агрегациями. Понимает отличия ClickHouse от строковых СУБД для аналитических задач. Выполняет простые когортные запросы с использованием функций дат и GROUP BY для анализа поведения пользователей во времени.
Data Engineer Обязателен Пишет аналитические запросы в ClickHouse: SELECT с GROUP BY, ORDER BY, LIMIT. Понимает MergeTree engine и партиционирование. Вставляет данные через INSERT и использует tabular форматы.
Data Scientist Запрашивает данные из ClickHouse через Python (clickhouse-driver, clickhouse-connect) для извлечения датасетов для ML-экспериментов. Преобразует результаты запросов в pandas DataFrame для разведочного анализа данных. Пишет базовые запросы выборки с использованием SAMPLE или ORDER BY rand() для создания репрезентативных обучающих подмножеств из больших таблиц.
Database Engineer / DBA Выполняет аналитические запросы в ClickHouse: SELECT с GROUP BY, фильтрация по datetime, базовые агрегации. Понимает колоночное хранение и MergeTree engine. Загружает данные из CSV и через INSERT.
Роль Обязательность Описание
Analytics Engineer Обязателен Пишет сложные аналитические запросы с использованием ClickHouse-специфичных функций: arrayJoin, windowFunnel, retention. Оптимизирует запросы через правильный выбор ORDER BY ключа и использование PREWHERE для фильтрации.
Backend Developer (Go) Обязателен Самостоятельно проектирует схемы и оптимизирует запросы с ClickHouse. Понимает индексирование и планы выполнения запросов. Использует sqlx/GORM эффективно.
BI Analyst Обязателен Проектирует материализованные представления в ClickHouse для предварительной агрегации метрик и ускорения дашбордов. Использует движки AggregatingMergeTree и SummingMergeTree для поддержания агрегатов в реальном времени. Пишет сложные запросы с GROUP BY, HAVING и вложенными подзапросами для интерактивных BI-отчётов с субсекундным временем отклика.
Data Analyst Обязателен Пишет продвинутые аналитические запросы с оконными функциями (ROW_NUMBER, LAG, LEAD, накопительные итоги) для анализа трендов и ранжирования. Применяет приближённые алгоритмы ClickHouse (uniqHLL12, quantileTDigest) для быстрых оценок на больших наборах данных. Строит когортные анализы удержания в масштабе, используя массивы и функции высшего порядка.
Data Engineer Обязателен Проектирует таблицы ClickHouse для аналитических pipeline-ов: выбор engine (MergeTree, AggregatingMergeTree, ReplacingMergeTree), partitioning by date, materialized views для pre-aggregation. Оптимизирует вставку через batch inserts.
Data Scientist Строит пайплайны извлечения признаков в ClickHouse с использованием агрегатных функций, оконных вычислений и операций с массивами для генерации ML-признаков в масштабе. Реализует эффективные стратегии стратифицированной выборки для подготовки обучающих данных на таблицах с миллиардами строк. Интегрирует ClickHouse с паттернами feature store, материализуя вычисленные признаки для повторного использования в нескольких ML-моделях.
Database Engineer / DBA Администрирует ClickHouse: настройка MergeTree partitioning, TTL для retention, materialized views для агрегации. Оптимизирует запросы через EXPLAIN PIPELINE. Настраивает мониторинг system-таблиц.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует аналитические таблицы в ClickHouse: выбор движков (MergeTree, AggregatingMergeTree), partition key для time-series данных. Настраивает материализованные представления для real-time агрегаций метрик.
Backend Developer (Go) Обязателен Интегрирует ClickHouse в Go-сервисы для аналитических задач: batch-вставки через clickhouse-go с буферизацией, материализованные представления, настройка партиционирования по дате. Оптимизирует запросы с учётом MergeTree-движков и колоночного хранения.
BI Analyst Обязателен Проектирует схемы ClickHouse, оптимизированные для BI-нагрузок, подбирая подходящие движки семейства MergeTree и стратегии партиционирования. Строит каскадные пайплайны материализованных представлений для многоуровневой агрегации. Оптимизирует производительность запросов через проекции, skip-индексы и словарные справочники измерений для дашбордов корпоративного масштаба.
Data Analyst Обязателен Проектирует оптимальные схемы таблиц и стратегии запросов для сложных аналитических нагрузок в ClickHouse. Владеет продвинутыми оконными функциями с пользовательскими фреймами для сложного анализа временных рядов. Реализует эффективные пайплайны когортного анализа на больших масштабах, используя материализованные представления, проекции и bitmap-функции для таблиц с миллиардами строк.
Data Engineer Обязателен Проектирует ClickHouse-архитектуру для data warehouse: distributed таблицы, sharding strategy, dictionary tables для joins. Оптимизирует запросы: projection, skip indexes, query pipeline tuning. Настраивает Kafka engine для streaming ingestion.
Data Scientist Обязателен Проектирует сквозные ML-пайплайны признаков на ClickHouse, оптимизируя извлечение данных для обучения и инференса. Использует встроенные ML-функции и статистические агрегаты ClickHouse для вычисления признаков внутри базы данных на петабайтных масштабах. Проектирует эффективные паттерны доступа к данным, минимизирующие потребление памяти при подаче больших датасетов в распределённые фреймворки обучения через чанковую итерацию.
Database Engineer / DBA Обязателен Проектирует ClickHouse-кластер: ReplicatedMergeTree, distributed таблицы, шардирование. Оптимизирует schema design для DBA-аналитики: query logs, slow query analysis, performance trends. Настраивает backup и disaster recovery.
Роль Обязательность Описание
Analytics Engineer Обязателен Определяет стратегию использования ClickHouse в аналитической платформе: как движок для real-time дашбордов, integration с dbt через ClickHouse-adapter. Внедряет стандарты моделирования и TTL-политики для управления хранением.
Backend Developer (Go) Обязателен Проектирует аналитическую архитектуру на ClickHouse для Go-платформы: ETL-пайплайны из Kafka в ClickHouse, стратегии денормализации, мониторинг query performance. Стандартизирует Go-библиотеки для работы с ClickHouse и определяет паттерны batch-загрузки.
BI Analyst Обязателен Определяет архитектурные стандарты ClickHouse для BI-платформы, включая топологию кластера, политики репликации и стратегии хранения данных. Устанавливает правила управления жизненным циклом материализованных представлений и эволюцией схем. Менторит аналитиков по паттернам оптимизации запросов и координирует обновления ClickHouse с минимальным простоем дашбордов.
Data Analyst Обязателен Устанавливает стандарты и лучшие практики запросов ClickHouse для аналитической команды, включая соглашения об именовании и рекомендации по производительности. Ревьюит сложные аналитические запросы и менторит аналитиков по оптимизации оконных функций и выбору приближённых алгоритмов. Координирует решения по моделированию данных, балансируя гибкость запросов с эффективностью хранения.
Data Engineer Обязателен Определяет ClickHouse-стандарты: schema design guidelines, naming conventions, monitoring через system tables. Выбирает ClickHouse vs другие OLAP (Druid, Pinot, DuckDB) по сценарию использования.
Data Scientist Обязателен Определяет стратегию работы с данными на уровне продукта. Формирует стандарты ClickHouse. Проводит review схем данных и стратегий масштабирования.
Database Engineer / DBA Обязателен Определяет ClickHouse-стандарты: naming conventions, partitioning strategy, retention policies. Координирует использование ClickHouse для централизованного хранения database metrics, audit logs, query analytics.
Роль Обязательность Описание
Analytics Engineer Обязателен Проектирует архитектуру real-time аналитики на ClickHouse: кластерная конфигурация, репликация, distributed-таблицы для масштабирования. Определяет когда использовать ClickHouse vs warehouse (Snowflake/BigQuery) для разных аналитических задач.
Backend Developer (Go) Обязателен Определяет стратегию аналитического хранилища на ClickHouse для организации: кластерная конфигурация, политики retention и tiered storage, интеграция с Go-сервисами через общие SDK. Разрабатывает стандарты моделирования данных для OLAP-сценариев.
BI Analyst Обязателен Формирует стратегию внедрения ClickHouse для BI-аналитики на уровне организации, оценивая компромиссы по сравнению с Druid или BigQuery. Проектирует мультитенантные архитектуры ClickHouse с изоляцией ресурсов и атрибуцией затрат. Определяет техническую дорожную карту для real-time BI, интегрируя ClickHouse с потоковыми платформами и семантическими слоями.
Data Analyst Обязателен Определяет архитектуру аналитических данных организации на ClickHouse, интегрируя его в общую платформу данных наряду с потоковыми и пакетными системами. Оценивает возможности ClickHouse относительно меняющихся аналитических потребностей и продвигает внедрение новых функций (lightweight deletes, обновляемые материализованные представления). Формирует стратегию найма и обучения с фокусом на экспертизу аналитики в ClickHouse.
Data Engineer Обязателен Проектирует OLAP-стратегию платформы: ClickHouse cluster topology, cross-DC replication, capacity planning. Определяет когда ClickHouse vs Snowflake/BigQuery. Планирует data serving layer архитектуру.
Data Scientist Обязателен Определяет стратегическую роль ClickHouse в ML-платформе, проектируя слои вычисления и сервинга признаков для поддержки real-time и пакетного инференса. Обеспечивает кросс-командное согласование стандартов feature engineering между дата-сайентистами и дата-инженерами с использованием ClickHouse как вычислительного ядра. Оценивает новые возможности ClickHouse для ML-нагрузок и формирует инвестиционную стратегию организации в аналитическую инфраструктуру.
Database Engineer / DBA Обязателен Формирует стратегию аналитической платформы: ClickHouse vs TimescaleDB vs InfluxDB для database observability. Проектирует архитектуру real-time analytics для мониторинга всего fleet-а баз данных организации.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для ClickHouse
Загрузка комментариев...