Data Scientist
Исследование данных и разработка ML-моделей для решения бизнес-задач
Data Scientist — роль в семействе ML & AI Engineering. Определено 78 навыков по 5 уровням (от Junior до Principal). 101 навыков являются обязательными. Ключевые домены: Основы программирования, Backend Development, Базы данных.
Технологический стек
Фокус по уровням
Exploratory Data Analysis (EDA). Построение baseline моделей. Feature engineering. Визуализация данных. Подготовка отчётов.
Формализация бизнес-задач в ML-задачи. Построение и валидация моделей. A/B тестирование. Презентация результатов стейкхолдерам.
Исследование новых подходов (NLP, CV, RecSys). Проектирование экспериментов. Публикация результатов. Менторинг. Кросс-функциональная работа.
Data Science стратегия. Приоритизация ML-проектов по бизнес-impact. Координация DS и Engineering. Стандарты экспериментирования.
AI research strategy. Публикации на конференциях. Формирование DS-культуры. Стратегия LLM/GenAI adoption.
Матрица навыков
78 навыков × 5 уровней. Нажмите на ячейку для детализации.
Архитектура и проектирование
1 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Основы System Design | A | W | A | E | E |
Базы данных
5 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| PostgreSQL | A | W | A | E | E |
| Продвинутый SQL | A | W | A | E | E |
| ClickHouse | A | W | A | E | E |
| Индексирование БД | A | W | A | E | E |
| Оптимизация запросов | A | W | A | E | E |
Безопасность
2 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| OWASP и безопасность приложений | A | W | A | E | E |
| Практики безопасного кода | A | W | A | E | E |
Контроль версий и коллаборация
2 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Git Advanced | A | W | A | E | E |
| Code Review | A | W | A | E | E |
Облако и инфраструктура
4 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Docker | A | W | A | E | E |
| Kubernetes Core | A | W | A | E | E |
| AWS | A | W | A | E | E |
| Основы сетей | A | W | A | E | E |
Основы программирования
7 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Алгоритмы и сложность | A | W | A | E | E |
| Структуры данных | A | W | A | E | E |
| Принципы ООП и SOLID | A | W | A | E | E |
| Паттерны проектирования | A | W | A | E | E |
| Многопоточное программирование | A | W | A | E | E |
| Асинхронное программирование | A | W | A | E | E |
| Качество кода и рефакторинг | A | W | A | E | E |
Тестирование и QA
3 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Unit-тестирование | A | W | A | E | E |
| Unit-тестирование | A | W | A | E | E |
| Интеграционное тестирование | A | W | A | E | E |
AI-ассистированная разработка
4 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| GitHub Copilot | A | W | A | E | E |
| Cursor IDE | A | W | A | A | — |
| ChatGPT / Claude | A | W | A | E | E |
| Prompt Engineering для кода | A | W | A | E | E |
API и интеграции
3 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| REST API Design | A | W | A | E | E |
| GraphQL Design | A | W | A | E | E |
| Документирование API | A | W | A | E | E |
Backend Development
2 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Python Web Frameworks | A | W | A | E | E |
| Redis | A | W | A | E | E |
Data Engineering
6 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Apache Spark | A | W | A | E | E |
| Pandas / Polars | A | W | A | E | E |
| SQL-based ETL | A | W | A | E | E |
| Data Quality | A | W | A | E | E |
| BI-дашборды | A | W | A | E | E |
| Визуализация данных | A | W | A | E | E |
DevOps и CI/CD
1 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| GitHub Actions / GitLab CI | A | W | A | E | E |
Machine Learning и AI
35 навыковObservability и мониторинг
3 навыков| Навыки | Jun | Mid | Sen | Lead | Princ |
|---|---|---|---|---|---|
| Структурированное логирование | A | W | A | E | E |
| Prometheus и Grafana | A | W | A | E | E |
| OpenTelemetry | A | W | A | E | E |
Часто задаваемые вопросы
Какие навыки нужны для роли Data Scientist?
Для роли Data Scientist требуется 78 навыков, из которых 101 являются обязательными. Навыки распределены по 5 уровням: от Junior до Principal. Смотреть полную матрицу.
Как вырасти до следующего уровня в роли Data Scientist?
Используйте Калькулятор грейда чтобы оценить текущий уровень и получить персональные рекомендации. Система покажет, какие навыки нужно развить для перехода на следующий уровень.
Какой технологический стек используется в роли Data Scientist?
Стек включает 5 технологий на разных уровнях. Python 3.11+, pandas, numpy, matplotlib/seaborn, scikit-learn, Jupyter, SQL, Python, scikit-learn, XGBoost/CatBoost/LightGBM, PyTorch basics, Optuna/Hyperopt, MLflow, SQL advanced, Spark basics, PyTorch/JAX, Transformers (HuggingFace), Deep Learning advanced, Causal Inference, Bayesian methods, Spark, LLM fine-tuning...
Как сообщество определяет требования к роли Data Scientist?
Требования к роли формируются сообществом через систему предложений. Любой участник может предложить изменения, которые проходят голосование и ревью экспертов.