Профиль навыка

ML-пайплайны

Kubeflow, Vertex AI, SageMaker Pipelines, воспроизводимость, автоматизация обучения

Machine Learning и AI MLOps

Ролей

6

где встречается этот навык

Грейдов

5

сформированная дорожка роста

Обязательных требований

21

ещё 9 — необязательные

Домен

Machine Learning и AI

Группа

MLOps

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль Обязательность Описание
Computer Vision Engineer Понимает этапы ML-пайплайнов для компьютерного зрения: загрузка данных, аугментация, обучение и оценка. Запускает существующие pipeline и отслеживает метрики экспериментов с помощью MLflow или Weights & Biases.
Data Scientist Обязателен Создаёт базовые ML-пайплайны через scikit-learn Pipeline: preprocessing, feature engineering, model training. Понимает важность pipeline для reproducibility и data leakage prevention. Сохраняет pipeline как единый артефакт для деплоя.
LLM Engineer Знает основы ML-pipeline: data loading, preprocessing, training, evaluation. Собирает простые pipeline для подготовки данных LLM fine-tuning с использованием Hugging Face Datasets.
ML Engineer Обязателен Понимает concept ML pipeline: data → features → training → evaluation → deployment. Пишет простые pipeline скрипты. Использует Airflow DAG для basic ML workflow.
MLOps Engineer Понимает концепции ML-пайплайнов: валидация данных, обучение модели и этапы деплоя. Настраивает runners пайплайнов (Airflow, Kubeflow) и мониторит метрики здоровья pipeline.
NLP Engineer Обязателен Знает основы ML-pipeline для NLP: сбор данных, preprocessing, feature extraction, обучение, evaluation. Использует scikit-learn Pipeline и spaCy для построения простых NLP-pipeline.
Роль Обязательность Описание
Computer Vision Engineer Строит сквозные ML-пайплайны для моделей компьютерного зрения: версионирование датасетов, распределённое обучение, подбор гиперпараметров и интеграцию с реестром моделей. Реализует проверки качества данных для image-датасетов.
Data Scientist Обязателен Проектирует production ML-пайплайны с использованием Airflow, Prefect или Dagster. Автоматизирует полный ML-цикл: data ingestion, validation, feature engineering, training, evaluation, deployment. Настраивает scheduling и retry-логику.
LLM Engineer Самостоятельно строит production ML-pipeline для LLM: data ingestion, cleaning, tokenization, training, evaluation. Использует Airflow или Prefect для оркестрации, обеспечивает idempotency.
ML Engineer Обязателен Проектирует ML pipelines с Kubeflow/Airflow. Настраивает параметризированные pipeline для разных моделей. Автоматизирует retraining с data quality checks. Реализует pipeline testing.
MLOps Engineer Реализует автоматизированные ML-пайплайны с feature stores, версионированием моделей и инфраструктурой A/B-тестирования. Строит CI/CD для обучения моделей с автоматическим перезапуском при обнаружении data drift.
NLP Engineer Обязателен Самостоятельно проектирует ML-pipeline для NLP-задач: data versioning, feature engineering для текстов, hyperparameter tuning, model selection. Автоматизирует через Airflow или Prefect.
Роль Обязательность Описание
Computer Vision Engineer Обязателен Проектирует масштабируемые архитектуры ML-пайплайнов для крупных систем компьютерного зрения: оркестрация multi-GPU обучения, workflow дистилляции моделей и production inference pipeline с оптимизацией латентности.
Data Scientist Обязателен Проектирует масштабируемые ML-пайплайны для enterprise: Kubeflow, Vertex AI Pipelines, SageMaker Pipelines. Реализует continuous training, automated model promotion. Оптимизирует pipeline performance через caching, parallel execution и incremental processing.
LLM Engineer Проектирует сложные ML-pipeline для LLM-платформы: multi-stage data processing, continuous training, automated retraining triggers. Оптимизирует пропускную способность и reliability pipeline.
ML Engineer Обязателен Проектирует ML pipeline architecture. Оптимизирует pipeline execution (caching, parallel steps). Настраивает CI/CD для pipeline deployment. Обеспечивает reproducibility.
MLOps Engineer Обязателен Проектирует корпоративную ML-платформу с оркестрацией пайплайнов, governance моделей и гарантиями воспроизводимости. Реализует canary-деплой моделей, автоматический откат при деградации производительности и cost-оптимизированную инфраструктуру обучения.
NLP Engineer Обязателен Проектирует production ML-pipeline для NLP-систем. Внедряет CI/CD для моделей, автоматическое переобучение по drift detection, A/B тестирование NLP-моделей с автоматическим продвижением.
Роль Обязательность Описание
Computer Vision Engineer Обязателен Определяет стратегию ML-пайплайны на уровне команды/продукта. Формирует стандарты и best practices. Проводит review.
Data Scientist Обязателен Определяет стратегию ML pipeline infrastructure для data science команды. Формирует стандарты pipeline development, testing и monitoring. Координирует унификацию pipeline-подходов между проектами и командами.
LLM Engineer Определяет ML pipeline стандарты для LLM-команды. Формирует guidelines по pipeline architecture, monitoring, error handling. Координирует pipeline infrastructure для training и inference.
ML Engineer Обязателен Определяет ML pipeline strategy. Стандартизирует pipeline components. Проектирует pipeline templating для ускорения разработки.
MLOps Engineer Обязателен Определяет стратегию ML-пайплайны на уровне команды/продукта. Формирует стандарты и best practices. Проводит review.
NLP Engineer Обязателен Определяет стандарты ML-pipeline для NLP-команды. Формирует MLOps best practices, определяет процессы model lifecycle management и обеспечивает воспроизводимость всех NLP-экспериментов.
Роль Обязательность Описание
Computer Vision Engineer Обязателен Определяет стратегию ML-пайплайны на уровне организации. Формирует enterprise-подходы. Менторит leads и architects.
Data Scientist Обязателен Формирует стратегию ML orchestration platform на уровне организации. Определяет enterprise requirements: scalability, governance, cost management. Проектирует unified ML pipeline platform для всех data science команд.
LLM Engineer Формирует enterprise ML pipeline платформу. Определяет подходы к unified pipeline framework, cross-team pipeline components, SLA и cost management для data/training/serving pipeline.
ML Engineer Обязателен Определяет ML pipeline platform strategy. Оценивает pipeline orchestrators. Проектирует enterprise ML pipeline architecture.
MLOps Engineer Обязателен Определяет стратегию ML-пайплайны на уровне организации. Формирует enterprise-подходы. Менторит leads и architects.
NLP Engineer Обязателен Формирует enterprise MLOps-стратегию для NLP-платформы. Определяет стандарты ML-pipeline, governance моделей и инфраструктуру для масштабирования NLP ML-операций на уровне организации.

Сообщество

👁 Следить ✏️ Предложить изменение Войдите, чтобы предлагать изменения
📋 Предложения
Пока нет предложений для ML-пайплайны
Загрузка комментариев...