Домен
Machine Learning и AI
Профиль навыка
Этот навык определяет ожидания по ролям и уровням.
Ролей
1
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
0
ещё 5 — необязательные
Machine Learning и AI
Классический ML
22.02.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Работает с pandas DataFrame для загрузки, очистки и анализа данных. Выполняет базовые операции: фильтрация, группировка, агрегация, merge/join. Использует numpy для математических операций и работы с массивами. Строит сводные таблицы и описательную статистику. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Эффективно работает с большими датасетами через pandas: чанковая обработка, оптимизация dtype, multi-index. Применяет vectorized operations numpy для высокопроизводительных вычислений. Использует pandas profiling для автоматического EDA. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Проектирует high-performance data processing pipelines на pandas/numpy. Применяет advanced техники: Cython extensions, numba JIT compilation для numpy. Оптимизирует memory footprint через chunked processing и memory-mapped arrays для out-of-core computing. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Определяет стандарты работы с данными для data science команды. Формирует shared data processing utilities и best practices. Координирует migration от pandas к distributed frameworks (Dask, Polars, Spark) при необходимости. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Формирует стратегию data processing stack для организации. Определяет когда использовать pandas vs Polars vs Spark для различных масштабов. Оценивает emerging tools и их fit для data science workflow организации. |