Р-Вижн

Data Scientist (NLP / LLM)

Не указана

Москва
От 1 года до 3 лет

R-Vision – разработчик надежных систем цифровизации и кибербезопасности. С 2011 года мы создаем технологии, которые помогают организациям эффективно противостоять киберугрозам, поддерживать надежность ИТ‑инфраструктуры и обеспечивать цифровую трансформацию.

Наши решения используются в крупнейших банках, государственных организациях, нефтегазовой отрасли, медиа, энергетике, металлургии, промышленности и в других сегментах бизнеса.

Мы постоянно развиваем существующие продукты, разрабатываем новые сервисы и тщательно сопровождаем процесс интеграции наших решений в инфраструктуру клиентов.

Благодаря командной работе и вкладу каждого сотрудника, нам удается достигать значимых результатов.

О нашей команде: Управление технологий искусственного интеллекта и анализа данных — это R&D команда. Мы непрерывно исследуем передовые AI/ML подходы и трансформируем их в прикладные ИИ-сервисы (AI-агенты, RAG-системы, NLP-пайплайны), которые встраиваются в коммерческие продукты для защиты наших клиентов.

Мы ищем именно прикладного исследователя, а не инженера инфраструктуры. У нас четко разделены роли: тебе не придется настраивать Kubernetes, поднимать Kafka или бороться с балансировщиками нагрузки — для этого есть выделенные MLOps и ML-инженеры.

Твоя зона ответственности — это математика, данные, архитектуры моделей, формирование/проверка гипотез и математическое доказательство качества.

Задачи:

Оценка качества и контроль галлюцинаций (Evals): Разработка методологии оценки качества генерации и поиска (LLM-as-a-judge, фреймворки типа RAGAS/DeepEval), создание эталонных датасетов (Golden Datasets) для непрерывного тестирования.
Развитие LLM и R&D: Подготовка данных и полный цикл дообучения открытых языковых моделей под специфику терминологии кибербеза. Формирование гипотез и проведение A/B тестирования различных архитектур.
Разработка специализированных SLM (Small Language Models): Подготовка данных, дистилляция знаний и дообучение компактных моделей для перевода естественного языка в структурированные запросы (Text-to-RQL / Text-to-SQL).
Построение логики RAG-систем: Проектирование архитектуры умного поиска (семантический чанкинг, гибридный поиск, Reranking) по корпоративным базам знаний, логам и инцидентам.
NLP и извлечение сущностей (NER): Обучение легковесных моделей для анализа неструктурированных данных (например: отчеты Threat Intelligence) и автоматического извлечения индикаторов сущностей различных типов.
Проектирование логики AI-агентов: Создание графов рассуждений (сценариев поведения), настройка Tool-calling и системных промптов для мультиагентных систем помощи аналитикам SOC.
Работа с данными: Проведение разведочного анализа (EDA), очистка и разметка сложных массивов данных (в том числе сырых логов).
Классическое машинное обучение: Применение классических алгоритмов машинного обучения для решения задач классификации/регрессии, где использование LLM избыточно

Ожидаем от тебя:

Уверенное владение Python (Pandas, NumPy, PyTorch) и умение писать оптимизированный код для проведения ML-экспериментов.
Глубокое понимание архитектуры Transformer.
Опыт оценки качества разрабатываемых систем машинного обучения (понимание метрик Recall@K, Precision, NDCG).
Опыт решения задач NLP (NER, классификация текстов) с использованием BERT-подобных моделей или LLM.
Уверенная работа с векторными БД и алгоритмами гибридного поиска.
Практический опыт подготовки данных и полного цикла дообучения языковых моделей (как больших LLM через современные методы PEFT: LoRA, QLoRA, DoRA, так и узкоспециализированных SLM для задач структурированной генерации формата JSON/RQL).
Сильная математическая база, понимание статистики и знание классических ML-алгоритмов.
Высшее профильное образование (Искусственный интеллект / Машинное обучение / Математика / Компьютерные науки).

Будет плюсом:

Понимание предметной области информационной безопасности.
Практический опыт проектирования графов состояний и логики для AI-агентов (LangGraph или аналоги).

Мы предлагаем:

Удаленный формат работы;
Достойную оплату труда, соответствующую профессиональному уровню и компетенциям;
Статус аккредитованной ИТ-компании со всеми преимуществами;
ДМС со стоматологией и госпитализацией по всей России, страхование от несчастного случая, полис ВЗР для поездок за границу, ветеринарная поддержка;
100% компенсацию больничного, +10 дополнительных дней в году на отгул по болезни;
Регулярный обмен обратной связью по системе полугодового Performance Review;
Возможности для обучения и профессионального развития: корпоративную библиотеку, менторство, внутренние митапы по обмену опытом, практику публичных выступлений, возможность участвовать в создании контента для профессиональных сообществ;
Программу корпоративных скидок и привилегий;
Развитую корпоративную культуру: открытую коммуникацию, онлайн и офлайн встречи, клубы по интересам, спортивные активности и поддержку инициатив сотрудников.

Несмотря на быстрый рост, мы основательно подходим к подбору специалистов, поэтому нам удалось собрать профессиональную и сплоченную команду.

Присоединяйся к нам!

Источник вакансии

Вернуться, к списку вакансий