Домен
Machine Learning и AI
Профиль навыка
Этот навык определяет ожидания по ролям и уровням.
Ролей
2
где встречается этот навык
Грейдов
5
сформированная дорожка роста
Обязательных требований
0
ещё 10 — необязательные
Machine Learning и AI
NLP
22.02.2026
Выберите текущий грейд и сравните ожидания. Карточки ниже покажут, что нужно закрыть для следующего уровня.
Таблица показывает, как меняется глубина владения навыком от Junior до Principal.
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Понимает основы NLP: токенизация, стемминг, лемматизация, bag-of-words, TF-IDF. Применяет базовые NLP-методы для text classification и sentiment analysis. Использует spaCy и NLTK для обработки текстов на русском и английском языках. | |
| LLM Engineer | Знает основы NLP: tokenization, stemming, NER, sentiment analysis. Понимает как классические NLP-задачи решаются с помощью LLM и применяет базовые техники text preprocessing. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Применяет современные NLP-методы: word embeddings (Word2Vec, FastText), sequence models (LSTM), pre-trained transformers (BERT, RuBERT). Решает задачи: NER, topic modeling, text summarization, semantic similarity. Fine-tunes BERT для domain-specific задач. | |
| LLM Engineer | Самостоятельно решает NLP-задачи с использованием LLM: text classification, NER, summarization, translation. Сравнивает LLM-подходы с классическими методами, выбирает оптимальный для задачи. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Проектирует production NLP-системы с LLM-integration. Разрабатывает RAG-pipelines, semantic search, document understanding системы. Оптимизирует NLP-модели для production: distillation, quantization, efficient inference. Работает с multilingual NLP. | |
| LLM Engineer | Проектирует комплексные NLP-системы на базе LLM: multi-task learning, zero-shot transfer, domain adaptation. Оптимизирует качество через prompt engineering, fine-tuning и ensemble подходы. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Определяет NLP-стратегию для data science команды. Формирует reusable NLP-компоненты и shared text processing infrastructure. Координирует выбор между custom NLP моделей и LLM-based подходов для различных задач. | |
| LLM Engineer | Определяет NLP-стратегию для LLM-команды. Формирует guidelines по выбору подходов (LLM vs classical NLP), evaluation methodology, domain adaptation стратегии для различных NLP-задач. |
| Роль | Обязательность | Описание |
|---|---|---|
| Data Scientist | Формирует NLP и LLM стратегию на уровне организации. Определяет investments в NLP-infrastructure, оценивает build vs buy для NLP-решений. Формирует научно-техническое лидерство в области обработки естественного языка. | |
| LLM Engineer | Формирует enterprise NLP стратегию на базе LLM. Определяет подходы к unified NLP platform, multi-language support, quality governance для NLP-задач на масштабе организации. |