Data Scientist

Исследование данных и разработка ML-моделей для решения бизнес-задач

ML & AI Engineering Junior Middle Senior Lead / Staff Principal
Полная матрица Карьерный трек PDF
78 навыков
5 уровней
101 обязательных
389 требований

Data Scientist — роль в семействе ML & AI Engineering. Определено 78 навыков по 5 уровням (от Junior до Principal). 101 навыков являются обязательными. Ключевые домены: Основы программирования, Backend Development, Базы данных.

Технологический стек

Junior Python 3.11+, pandas, numpy, matplotlib/seaborn, scikit-learn, Jupyter, SQL
Middle Python, scikit-learn, XGBoost/CatBoost/LightGBM, PyTorch basics, Optuna/Hyperopt, MLflow, SQL advanced, Spark basics
Senior PyTorch/JAX, Transformers (HuggingFace), Deep Learning advanced, Causal Inference, Bayesian methods, Spark, LLM fine-tuning
Lead / Staff DS Platform, Experiment tracking, Model governance, LLM orchestration (LangChain), Automated ML (AutoML)
Principal Research infrastructure, LLM strategy, Multi-modal AI, Publishing pipeline

Фокус по уровням

Junior

Exploratory Data Analysis (EDA). Построение baseline моделей. Feature engineering. Визуализация данных. Подготовка отчётов.

Middle

Формализация бизнес-задач в ML-задачи. Построение и валидация моделей. A/B тестирование. Презентация результатов стейкхолдерам.

Senior

Исследование новых подходов (NLP, CV, RecSys). Проектирование экспериментов. Публикация результатов. Менторинг. Кросс-функциональная работа.

Lead / Staff

Data Science стратегия. Приоритизация ML-проектов по бизнес-impact. Координация DS и Engineering. Стандарты экспериментирования.

Principal

AI research strategy. Публикации на конференциях. Формирование DS-культуры. Стратегия LLM/GenAI adoption.

Матрица навыков

78 навыков × 5 уровней. Нажмите на ячейку для детализации.

A Awareness W Working V Advanced E Expert

Архитектура и проектирование

1 навыков
Навыки Jun Mid Sen Lead Princ
Основы System Design A W A E E

Базы данных

5 навыков
Навыки Jun Mid Sen Lead Princ
PostgreSQL A W A E E
Продвинутый SQL A W A E E
ClickHouse A W A E E
Индексирование БД A W A E E
Оптимизация запросов A W A E E

Безопасность

2 навыков

Контроль версий и коллаборация

2 навыков
Навыки Jun Mid Sen Lead Princ
Git Advanced A W A E E
Code Review A W A E E

Облако и инфраструктура

4 навыков
Навыки Jun Mid Sen Lead Princ
Docker A W A E E
Kubernetes Core A W A E E
AWS A W A E E
Основы сетей A W A E E

Тестирование и QA

3 навыков

AI-ассистированная разработка

4 навыков
Навыки Jun Mid Sen Lead Princ
GitHub Copilot A W A E E
Cursor IDE A W A A
ChatGPT / Claude A W A E E
Prompt Engineering для кода A W A E E

API и интеграции

3 навыков
Навыки Jun Mid Sen Lead Princ
REST API Design A W A E E
GraphQL Design A W A E E
Документирование API A W A E E

Backend Development

2 навыков
Навыки Jun Mid Sen Lead Princ
Python Web Frameworks A W A E E
Redis A W A E E

Data Engineering

6 навыков
Навыки Jun Mid Sen Lead Princ
Apache Spark A W A E E
Pandas / Polars A W A E E
SQL-based ETL A W A E E
Data Quality A W A E E
BI-дашборды A W A E E
Визуализация данных A W A E E

DevOps и CI/CD

1 навыков
Навыки Jun Mid Sen Lead Princ
GitHub Actions / GitLab CI A W A E E

Observability и мониторинг

3 навыков
Навыки Jun Mid Sen Lead Princ
Структурированное логирование A W A E E
Prometheus и Grafana A W A E E
OpenTelemetry A W A E E

Часто задаваемые вопросы

Какие навыки нужны для роли Data Scientist?

Для роли Data Scientist требуется 78 навыков, из которых 101 являются обязательными. Навыки распределены по 5 уровням: от Junior до Principal. Смотреть полную матрицу.

Как вырасти до следующего уровня в роли Data Scientist?

Используйте Калькулятор грейда чтобы оценить текущий уровень и получить персональные рекомендации. Система покажет, какие навыки нужно развить для перехода на следующий уровень.

Какой технологический стек используется в роли Data Scientist?

Стек включает 5 технологий на разных уровнях. Python 3.11+, pandas, numpy, matplotlib/seaborn, scikit-learn, Jupyter, SQL, Python, scikit-learn, XGBoost/CatBoost/LightGBM, PyTorch basics, Optuna/Hyperopt, MLflow, SQL advanced, Spark basics, PyTorch/JAX, Transformers (HuggingFace), Deep Learning advanced, Causal Inference, Bayesian methods, Spark, LLM fine-tuning...

Как сообщество определяет требования к роли Data Scientist?

Требования к роли формируются сообществом через систему предложений. Любой участник может предложить изменения, которые проходят голосование и ревью экспертов.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для Data Scientist
Загрузка комментариев...