Яндекс

ML-разработчик в Яндекс Образование

Не указана

Москва
От 3 до 6 лет

Python

Яндекс Образование создаёт образовательные продукты для школьников, родителей и учителей, а также инструменты для всего образовательного сообщества. Мы разрабатываем технологичные решения, включая AI-инструменты, которые помогают детям осваивать IT-навыки, учиться эффективнее и получать современное образование, а взрослым — лучше понимать и сопровождать этот процесс.

Наша стратегическая цель — создать интеллектуального AI-репетитора: диалоговую систему, которая умеет вести осмысленный учебный диалог, оценивать уровень знаний, находить пробелы, объяснять сложные темы и формировать персональные рекомендации по обучению.

Мы ищем ML-разработчика с сильным бэкграундом в NLP и LLM, который будет участвовать в создании и развитии такого тьютора: от исследований и экспериментов до продакшен-систем, обслуживающих сотни тысяч пользователей.

Какие задачи вас ждут:

Улучшение базового качества диалога для достижения образовательных целей
Вы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области.

Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса).

Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом.

Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы.

Мы ждем, что вы:

Уверенно владеете Python и работали с PyTorch
Знакомы с основами обучения LLM
Работали с vLLM для развёртывания LLM
Обладаете крепкой базой знаний в ML

Будет плюсом, если вы:

Работали с DL в области речевых технологий
Внедряли нейросетевые модели в продакшен
Работали с большими данными

Источник вакансии

Вернуться, к списку вакансий