Профиль навыка

Classical ML (scikit-learn)

Regression, classification, clustering, feature engineering, cross-validation

Machine Learning и AI Классический ML

Ролей

где встречается этот навык

Грейдов

сформированная дорожка роста

Обязательных требований

ещё 6 — необязательные

Домен

Machine Learning и AI

Группа

Классический ML

Последнее обновление

17.03.2026

Как использовать

Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.

Чего ждут на каждом уровне

Таблица показывает, как меняется глубина владения навыком от Junior до Principal.

Роль	Обязательность	Описание
Computer Vision Engineer		Понимает основные estimators scikit-learn (SVM, Random Forest, KNN) для классификации визуальных признаков. Применяет базовые pipelines со StandardScaler и PCA для предобработки признаков. Следует командным стандартам кросс-валидации на image datasets.
Data Analyst		Понимает базовые модели scikit-learn (Linear Regression, Decision Trees, KMeans) для аналитических задач. Применяет train_test_split и cross_val_score для проверки гипотез. Следует командным стандартам предобработки с SimpleImputer и LabelEncoder.
Data Scientist		Понимает фундаментальные алгоритмы scikit-learn (LogisticRegression, RandomForest, GradientBoosting) и их допущения. Применяет Pipeline и ColumnTransformer для воспроизводимого feature engineering. Следует гайдлайнам оценки моделей через classification_report и ROC-AUC.
ML Engineer	Обязателен	Обучает baseline модели с scikit-learn: Linear Regression, Logistic Regression, Random Forest. Выполняет cross-validation и train/test split. Использует Pipeline для preprocessing + model.
NLP Engineer	Обязателен	Знает основы scikit-learn для NLP: TF-IDF vectorizer, text classification через SVM/Naive Bayes, Pipeline. Обучает baseline NLP-модели и оценивает через cross-validation.

Роль	Обязательность	Описание
Computer Vision Engineer		Самостоятельно строит scikit-learn pipelines для извлечения HOG/SIFT-признаков с SVM и ensemble-классификаторами для распознавания изображений. Понимает компромиссы между сложностью модели и скоростью inference. Настраивает гиперпараметры через GridSearchCV.
Data Analyst		Самостоятельно применяет кластеризацию scikit-learn (DBSCAN, KMeans) и снижение размерности (PCA, t-SNE) для разведочного анализа. Понимает компромиссы между интерпретируемостью и точностью моделей для стейкхолдеров. Строит pipelines с feature selection для прогнозирования бизнес-метрик.
Data Scientist		Самостоятельно проектирует эксперименты scikit-learn со стратифицированной кросс-валидацией и кастомными scorers. Понимает компромиссы bias-variance между регуляризованными моделями (Ridge, Lasso) и tree ensembles. Строит production pipelines с кастомными transformers и FeatureUnion.
ML Engineer	Обязателен	Проектирует sklearn Pipelines для production. Выполняет feature selection (SelectKBest, RFE). Настраивает hyperparameter tuning (GridSearchCV, RandomizedSearchCV, Optuna). Обрабатывает imbalanced данные (SMOTE, class_weight).
NLP Engineer	Обязателен	Самостоятельно разрабатывает NLP-модели на scikit-learn: feature engineering для текстов, ensemble methods, hyperparameter tuning через GridSearchCV. Сравнивает с deep learning подходами.

Роль	Обязательность	Описание
Computer Vision Engineer	Обязателен	Обладает глубокой экспертизой комбинирования scikit-learn classical ML с deep learning feature extractors для гибридных CV-систем. Проектирует масштабируемые prediction-сервисы с joblib-сериализацией и оптимизацией sparse-матриц. Менторит команду по валидации несбалансированных визуальных датасетов.
Data Analyst	Обязателен	Обладает глубокой экспертизой в интерпретируемости моделей scikit-learn через permutation_importance и интеграцию SHAP для отчётности руководству. Проектирует автоматизированные аналитические pipelines для регулярных BI-задач. Менторит аналитиков по предотвращению data leakage и стратегиям holdout.
Data Scientist	Обязателен	Обладает глубокой экспертизой в расширении scikit-learn кастомными estimators, meta-learners и stacking ensembles для production ML. Проектирует выбор моделей с Bayesian optimization и автоматизированным feature engineering. Менторит команду по воспроизводимости экспериментов и версионированию.
ML Engineer	Обязателен	Проектирует ML-системы на scikit-learn для production. Создаёт custom transformers и estimators. Оптимизирует pipeline performance. Интегрирует sklearn с MLflow для tracking и serving.
NLP Engineer	Обязателен	Проектирует production ML-pipeline для NLP на scikit-learn: custom transformers, pipeline с caching, calibrated classifiers. Применяет для lightweight NLP-задач где deep learning избыточен.

Роль	Обязательность	Описание
Computer Vision Engineer	Обязателен	Определяет стратегию команды по интеграции scikit-learn classical ML в CV-pipeline наряду с deep learning. Устанавливает стандарты бенчмаркинга моделей и протоколов оценки для задач detection и classification. Проводит ревью архитектуры ML-pipelines на воспроизводимость.
Data Analyst	Обязателен	Определяет стратегию аналитической команды по применению scikit-learn в системах BI и поддержки решений. Устанавливает стандарты валидации моделей, документирования допущений и воспроизводимой отчётности. Проводит ревью, обеспечивая статистическую строгость и интерпретируемость для стейкхолдеров.
Data Scientist	Обязателен	Определяет стратегию Classical ML (scikit-learn) на уровне команды/продукта. Формирует стандарты и best practices. Проводит review.
ML Engineer	Обязателен	Определяет стандарты использования scikit-learn в организации. Оценивает sklearn vs deep learning для разных задач. Создаёт feature engineering framework на основе sklearn.
NLP Engineer	Обязателен	Определяет стандарты использования scikit-learn в NLP-команде. Формирует decision framework для выбора между ML и DL подходами, обеспечивает quality baseline моделей.

Роль	Обязательность	Описание
Computer Vision Engineer	Обязателен	Определяет организационную стратегию scikit-learn classical ML в CV-продуктах, устанавливая когда классические подходы лучше deep learning по стоимости и latency. Задаёт корпоративные стандарты governance ML-моделей и кросс-командного обмена знаниями. Менторит лидов по гибридным ML-архитектурам.
Data Analyst	Обязателен	Определяет организационную стратегию scikit-learn в корпоративной аналитике, устанавливая governance для принятия решений на основе моделей. Задаёт корпоративные стандарты жизненного цикла аналитических моделей от прототипов до автоотчётов. Менторит лидов по self-service ML для стейкхолдеров.
Data Scientist	Обязателен	Определяет стратегию Classical ML (scikit-learn) на уровне организации. Формирует enterprise-подходы. Менторит leads и architects.
ML Engineer	Обязателен	Определяет ML modeling strategy для организации. Оценивает novel classical ML подходы. Формирует best practices для production ML systems.
NLP Engineer	Обязателен	Формирует enterprise-стратегию использования classical ML для NLP. Определяет стандарты baseline моделей, evaluation methodology и model selection governance на уровне организации.

Junior 5 требований

Computer Vision Engineer

Понимает основные estimators scikit-learn (SVM, Random Forest, KNN) для классификации визуальных признаков. Применяет базовые pipelines со StandardScaler и PCA для предобработки признаков. Следует командным стандартам кросс-валидации на image datasets.
Data Analyst

Понимает базовые модели scikit-learn (Linear Regression, Decision Trees, KMeans) для аналитических задач. Применяет train_test_split и cross_val_score для проверки гипотез. Следует командным стандартам предобработки с SimpleImputer и LabelEncoder.
Data Scientist

Понимает фундаментальные алгоритмы scikit-learn (LogisticRegression, RandomForest, GradientBoosting) и их допущения. Применяет Pipeline и ColumnTransformer для воспроизводимого feature engineering. Следует гайдлайнам оценки моделей через classification_report и ROC-AUC.

Middle 5 требований

Computer Vision Engineer

Самостоятельно строит scikit-learn pipelines для извлечения HOG/SIFT-признаков с SVM и ensemble-классификаторами для распознавания изображений. Понимает компромиссы между сложностью модели и скоростью inference. Настраивает гиперпараметры через GridSearchCV.
Data Analyst

Самостоятельно применяет кластеризацию scikit-learn (DBSCAN, KMeans) и снижение размерности (PCA, t-SNE) для разведочного анализа. Понимает компромиссы между интерпретируемостью и точностью моделей для стейкхолдеров. Строит pipelines с feature selection для прогнозирования бизнес-метрик.
Data Scientist

Самостоятельно проектирует эксперименты scikit-learn со стратифицированной кросс-валидацией и кастомными scorers. Понимает компромиссы bias-variance между регуляризованными моделями (Ridge, Lasso) и tree ensembles. Строит production pipelines с кастомными transformers и FeatureUnion.

Senior 5 требований

Computer Vision Engineer
Обязателен

Обладает глубокой экспертизой комбинирования scikit-learn classical ML с deep learning feature extractors для гибридных CV-систем. Проектирует масштабируемые prediction-сервисы с joblib-сериализацией и оптимизацией sparse-матриц. Менторит команду по валидации несбалансированных визуальных датасетов.
Data Analyst
Обязателен

Обладает глубокой экспертизой в интерпретируемости моделей scikit-learn через permutation_importance и интеграцию SHAP для отчётности руководству. Проектирует автоматизированные аналитические pipelines для регулярных BI-задач. Менторит аналитиков по предотвращению data leakage и стратегиям holdout.
Data Scientist
Обязателен

Обладает глубокой экспертизой в расширении scikit-learn кастомными estimators, meta-learners и stacking ensembles для production ML. Проектирует выбор моделей с Bayesian optimization и автоматизированным feature engineering. Менторит команду по воспроизводимости экспериментов и версионированию.

Lead / Staff 5 требований

Computer Vision Engineer
Обязателен

Определяет стратегию команды по интеграции scikit-learn classical ML в CV-pipeline наряду с deep learning. Устанавливает стандарты бенчмаркинга моделей и протоколов оценки для задач detection и classification. Проводит ревью архитектуры ML-pipelines на воспроизводимость.
Data Analyst
Обязателен

Определяет стратегию аналитической команды по применению scikit-learn в системах BI и поддержки решений. Устанавливает стандарты валидации моделей, документирования допущений и воспроизводимой отчётности. Проводит ревью, обеспечивая статистическую строгость и интерпретируемость для стейкхолдеров.
Data Scientist
Обязателен

Определяет стратегию Classical ML (scikit-learn) на уровне команды/продукта. Формирует стандарты и best practices. Проводит review.

Principal 5 требований

Computer Vision Engineer
Обязателен

Определяет организационную стратегию scikit-learn classical ML в CV-продуктах, устанавливая когда классические подходы лучше deep learning по стоимости и latency. Задаёт корпоративные стандарты governance ML-моделей и кросс-командного обмена знаниями. Менторит лидов по гибридным ML-архитектурам.
Data Analyst
Обязателен

Определяет организационную стратегию scikit-learn в корпоративной аналитике, устанавливая governance для принятия решений на основе моделей. Задаёт корпоративные стандарты жизненного цикла аналитических моделей от прототипов до автоотчётов. Менторит лидов по self-service ML для стейкхолдеров.
Data Scientist
Обязателен

Определяет стратегию Classical ML (scikit-learn) на уровне организации. Формирует enterprise-подходы. Менторит leads и architects.

Сообщество

👁 Следить ✏️ Предложить изменение

Загрузка комментариев...