Домен
Machine Learning и AI
Профиль навыка
Regression, classification, clustering, feature engineering, cross-validation
Ролей
5
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
19
ещё 6 — необязательные
Machine Learning и AI
Классический ML
17.03.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Понимает основные estimators scikit-learn (SVM, Random Forest, KNN) для классификации визуальных признаков. Применяет базовые pipelines со StandardScaler и PCA для предобработки признаков. Следует командным стандартам кросс-валидации на image datasets. | |
| Data Analyst | Понимает базовые модели scikit-learn (Linear Regression, Decision Trees, KMeans) для аналитических задач. Применяет train_test_split и cross_val_score для проверки гипотез. Следует командным стандартам предобработки с SimpleImputer и LabelEncoder. | |
| Data Scientist | Понимает фундаментальные алгоритмы scikit-learn (LogisticRegression, RandomForest, GradientBoosting) и их допущения. Применяет Pipeline и ColumnTransformer для воспроизводимого feature engineering. Следует гайдлайнам оценки моделей через classification_report и ROC-AUC. | |
| ML Engineer | Обязателен | Обучает baseline модели с scikit-learn: Linear Regression, Logistic Regression, Random Forest. Выполняет cross-validation и train/test split. Использует Pipeline для preprocessing + model. |
| NLP Engineer | Обязателен | Знает основы scikit-learn для NLP: TF-IDF vectorizer, text classification через SVM/Naive Bayes, Pipeline. Обучает baseline NLP-модели и оценивает через cross-validation. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Самостоятельно строит scikit-learn pipelines для извлечения HOG/SIFT-признаков с SVM и ensemble-классификаторами для распознавания изображений. Понимает компромиссы между сложностью модели и скоростью inference. Настраивает гиперпараметры через GridSearchCV. | |
| Data Analyst | Самостоятельно применяет кластеризацию scikit-learn (DBSCAN, KMeans) и снижение размерности (PCA, t-SNE) для разведочного анализа. Понимает компромиссы между интерпретируемостью и точностью моделей для стейкхолдеров. Строит pipelines с feature selection для прогнозирования бизнес-метрик. | |
| Data Scientist | Самостоятельно проектирует эксперименты scikit-learn со стратифицированной кросс-валидацией и кастомными scorers. Понимает компромиссы bias-variance между регуляризованными моделями (Ridge, Lasso) и tree ensembles. Строит production pipelines с кастомными transformers и FeatureUnion. | |
| ML Engineer | Обязателен | Проектирует sklearn Pipelines для production. Выполняет feature selection (SelectKBest, RFE). Настраивает hyperparameter tuning (GridSearchCV, RandomizedSearchCV, Optuna). Обрабатывает imbalanced данные (SMOTE, class_weight). |
| NLP Engineer | Обязателен | Самостоятельно разрабатывает NLP-модели на scikit-learn: feature engineering для текстов, ensemble methods, hyperparameter tuning через GridSearchCV. Сравнивает с deep learning подходами. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Обладает глубокой экспертизой комбинирования scikit-learn classical ML с deep learning feature extractors для гибридных CV-систем. Проектирует масштабируемые prediction-сервисы с joblib-сериализацией и оптимизацией sparse-матриц. Менторит команду по валидации несбалансированных визуальных датасетов. |
| Data Analyst | Обязателен | Обладает глубокой экспертизой в интерпретируемости моделей scikit-learn через permutation_importance и интеграцию SHAP для отчётности руководству. Проектирует автоматизированные аналитические pipelines для регулярных BI-задач. Менторит аналитиков по предотвращению data leakage и стратегиям holdout. |
| Data Scientist | Обязателен | Обладает глубокой экспертизой в расширении scikit-learn кастомными estimators, meta-learners и stacking ensembles для production ML. Проектирует выбор моделей с Bayesian optimization и автоматизированным feature engineering. Менторит команду по воспроизводимости экспериментов и версионированию. |
| ML Engineer | Обязателен | Проектирует ML-системы на scikit-learn для production. Создаёт custom transformers и estimators. Оптимизирует pipeline performance. Интегрирует sklearn с MLflow для tracking и serving. |
| NLP Engineer | Обязателен | Проектирует production ML-pipeline для NLP на scikit-learn: custom transformers, pipeline с caching, calibrated classifiers. Применяет для lightweight NLP-задач где deep learning избыточен. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Определяет стратегию команды по интеграции scikit-learn classical ML в CV-pipeline наряду с deep learning. Устанавливает стандарты бенчмаркинга моделей и протоколов оценки для задач detection и classification. Проводит ревью архитектуры ML-pipelines на воспроизводимость. |
| Data Analyst | Обязателен | Определяет стратегию аналитической команды по применению scikit-learn в системах BI и поддержки решений. Устанавливает стандарты валидации моделей, документирования допущений и воспроизводимой отчётности. Проводит ревью, обеспечивая статистическую строгость и интерпретируемость для стейкхолдеров. |
| Data Scientist | Обязателен | Определяет стратегию Classical ML (scikit-learn) на уровне команды/продукта. Формирует стандарты и best practices. Проводит review. |
| ML Engineer | Обязателен | Определяет стандарты использования scikit-learn в организации. Оценивает sklearn vs deep learning для разных задач. Создаёт feature engineering framework на основе sklearn. |
| NLP Engineer | Обязателен | Определяет стандарты использования scikit-learn в NLP-команде. Формирует decision framework для выбора между ML и DL подходами, обеспечивает quality baseline моделей. |
| Роль | Обязательность | Описание |
|---|---|---|
| Computer Vision Engineer | Обязателен | Определяет организационную стратегию scikit-learn classical ML в CV-продуктах, устанавливая когда классические подходы лучше deep learning по стоимости и latency. Задаёт корпоративные стандарты governance ML-моделей и кросс-командного обмена знаниями. Менторит лидов по гибридным ML-архитектурам. |
| Data Analyst | Обязателен | Определяет организационную стратегию scikit-learn в корпоративной аналитике, устанавливая governance для принятия решений на основе моделей. Задаёт корпоративные стандарты жизненного цикла аналитических моделей от прототипов до автоотчётов. Менторит лидов по self-service ML для стейкхолдеров. |
| Data Scientist | Обязателен | Определяет стратегию Classical ML (scikit-learn) на уровне организации. Формирует enterprise-подходы. Менторит leads и architects. |
| ML Engineer | Обязателен | Определяет ML modeling strategy для организации. Оценивает novel classical ML подходы. Формирует best practices для production ML systems. |
| NLP Engineer | Обязателен | Формирует enterprise-стратегию использования classical ML для NLP. Определяет стандарты baseline моделей, evaluation methodology и model selection governance на уровне организации. |