Домен
Machine Learning и AI
Профиль навыка
Kubeflow, Vertex AI, SageMaker Pipelines, воспроизводимость, автоматизация обучения
Ролей
6
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
21
ещё 9 — необязательные
Machine Learning и AI
MLOps
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Понимает этапы ML-пайплайнов для компьютерного зрения: загрузка данных, аугментация, обучение и оценка. Запускает существующие pipeline и отслеживает метрики экспериментов с помощью MLflow или Weights & Biases. | |
| Data Scientist | Обязателен | Создаёт базовые ML-пайплайны через scikit-learn Pipeline: preprocessing, feature engineering, model training. Понимает важность pipeline для reproducibility и data leakage prevention. Сохраняет pipeline как единый артефакт для деплоя. |
| LLM Engineer | Знает основы ML-pipeline: data loading, preprocessing, training, evaluation. Собирает простые pipeline для подготовки данных LLM fine-tuning с использованием Hugging Face Datasets. | |
| ML Engineer | Обязателен | Понимает concept ML pipeline: data → features → training → evaluation → deployment. Пишет простые pipeline скрипты. Использует Airflow DAG для basic ML workflow. |
| MLOps Engineer | Понимает концепции ML-пайплайнов: валидация данных, обучение модели и этапы деплоя. Настраивает runners пайплайнов (Airflow, Kubeflow) и мониторит метрики здоровья pipeline. | |
| NLP Engineer | Обязателен | Знает основы ML-pipeline для NLP: сбор данных, preprocessing, feature extraction, обучение, evaluation. Использует scikit-learn Pipeline и spaCy для построения простых NLP-pipeline. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Строит сквозные ML-пайплайны для моделей компьютерного зрения: версионирование датасетов, распределённое обучение, подбор гиперпараметров и интеграцию с реестром моделей. Реализует проверки качества данных для image-датасетов. | |
| Data Scientist | Обязателен | Проектирует production ML-пайплайны с использованием Airflow, Prefect или Dagster. Автоматизирует полный ML-цикл: data ingestion, validation, feature engineering, training, evaluation, deployment. Настраивает scheduling и retry-логику. |
| LLM Engineer | Самостоятельно строит production ML-pipeline для LLM: data ingestion, cleaning, tokenization, training, evaluation. Использует Airflow или Prefect для оркестрации, обеспечивает idempotency. | |
| ML Engineer | Обязателен | Проектирует ML pipelines с Kubeflow/Airflow. Настраивает параметризированные pipeline для разных моделей. Автоматизирует retraining с data quality checks. Реализует pipeline testing. |
| MLOps Engineer | Реализует автоматизированные ML-пайплайны с feature stores, версионированием моделей и инфраструктурой A/B-тестирования. Строит CI/CD для обучения моделей с автоматическим перезапуском при обнаружении data drift. | |
| NLP Engineer | Обязателен | Самостоятельно проектирует ML-pipeline для NLP-задач: data versioning, feature engineering для текстов, hyperparameter tuning, model selection. Автоматизирует через Airflow или Prefect. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Проектирует масштабируемые архитектуры ML-пайплайнов для крупных систем компьютерного зрения: оркестрация multi-GPU обучения, workflow дистилляции моделей и production inference pipeline с оптимизацией латентности. |
| Data Scientist | Обязателен | Проектирует масштабируемые ML-пайплайны для enterprise: Kubeflow, Vertex AI Pipelines, SageMaker Pipelines. Реализует continuous training, automated model promotion. Оптимизирует pipeline performance через caching, parallel execution и incremental processing. |
| LLM Engineer | Проектирует сложные ML-pipeline для LLM-платформы: multi-stage data processing, continuous training, automated retraining triggers. Оптимизирует пропускную способность и reliability pipeline. | |
| ML Engineer | Обязателен | Проектирует ML pipeline architecture. Оптимизирует pipeline execution (caching, parallel steps). Настраивает CI/CD для pipeline deployment. Обеспечивает reproducibility. |
| MLOps Engineer | Обязателен | Проектирует корпоративную ML-платформу с оркестрацией пайплайнов, governance моделей и гарантиями воспроизводимости. Реализует canary-деплой моделей, автоматический откат при деградации производительности и cost-оптимизированную инфраструктуру обучения. |
| NLP Engineer | Обязателен | Проектирует production ML-pipeline для NLP-систем. Внедряет CI/CD для моделей, автоматическое переобучение по drift detection, A/B тестирование NLP-моделей с автоматическим продвижением. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Определяет стратегию ML-пайплайны на уровне команды/продукта. Формирует стандарты и best practices. Проводит review. |
| Data Scientist | Обязателен | Определяет стратегию ML pipeline infrastructure для data science команды. Формирует стандарты pipeline development, testing и monitoring. Координирует унификацию pipeline-подходов между проектами и командами. |
| LLM Engineer | Определяет ML pipeline стандарты для LLM-команды. Формирует guidelines по pipeline architecture, monitoring, error handling. Координирует pipeline infrastructure для training и inference. | |
| ML Engineer | Обязателен | Определяет ML pipeline strategy. Стандартизирует pipeline components. Проектирует pipeline templating для ускорения разработки. |
| MLOps Engineer | Обязателен | Определяет стратегию ML-пайплайны на уровне команды/продукта. Формирует стандарты и best practices. Проводит review. |
| NLP Engineer | Обязателен | Определяет стандарты ML-pipeline для NLP-команды. Формирует MLOps best practices, определяет процессы model lifecycle management и обеспечивает воспроизводимость всех NLP-экспериментов. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Определяет стратегию ML-пайплайны на уровне организации. Формирует enterprise-подходы. Менторит leads и architects. |
| Data Scientist | Обязателен | Формирует стратегию ML orchestration platform на уровне организации. Определяет enterprise requirements: scalability, governance, cost management. Проектирует unified ML pipeline platform для всех data science команд. |
| LLM Engineer | Формирует enterprise ML pipeline платформу. Определяет подходы к unified pipeline framework, cross-team pipeline components, SLA и cost management для data/training/serving pipeline. | |
| ML Engineer | Обязателен | Определяет ML pipeline platform strategy. Оценивает pipeline orchestrators. Проектирует enterprise ML pipeline architecture. |
| MLOps Engineer | Обязателен | Определяет стратегию ML-пайплайны на уровне организации. Формирует enterprise-подходы. Менторит leads и architects. |
| NLP Engineer | Обязателен | Формирует enterprise MLOps-стратегию для NLP-платформы. Определяет стандарты ML-pipeline, governance моделей и инфраструктуру для масштабирования NLP ML-операций на уровне организации. |