Р-Вижн

Data Scientist (NLP / LLM)

Не указана
  • Москва
  • От 1 года до 3 лет

R-Vision – разработчик надежных систем цифровизации и кибербезопасности. С 2011 года мы создаем технологии, которые помогают организациям эффективно противостоять киберугрозам, поддерживать надежность ИТ‑инфраструктуры и обеспечивать цифровую трансформацию.

Наши решения используются в крупнейших банках, государственных организациях, нефтегазовой отрасли, медиа, энергетике, металлургии, промышленности и в других сегментах бизнеса.

Мы постоянно развиваем существующие продукты, разрабатываем новые сервисы и тщательно сопровождаем процесс интеграции наших решений в инфраструктуру клиентов.

Благодаря командной работе и вкладу каждого сотрудника, нам удается достигать значимых результатов.

О нашей команде: Управление технологий искусственного интеллекта и анализа данных — это R&D команда. Мы непрерывно исследуем передовые AI/ML подходы и трансформируем их в прикладные ИИ-сервисы (AI-агенты, RAG-системы, NLP-пайплайны), которые встраиваются в коммерческие продукты для защиты наших клиентов.

Мы ищем именно прикладного исследователя, а не инженера инфраструктуры. У нас четко разделены роли: тебе не придется настраивать Kubernetes, поднимать Kafka или бороться с балансировщиками нагрузки — для этого есть выделенные MLOps и ML-инженеры.

Твоя зона ответственности — это математика, данные, архитектуры моделей, формирование/проверка гипотез и математическое доказательство качества.

Задачи:

  • Оценка качества и контроль галлюцинаций (Evals): Разработка методологии оценки качества генерации и поиска (LLM-as-a-judge, фреймворки типа RAGAS/DeepEval), создание эталонных датасетов (Golden Datasets) для непрерывного тестирования.
  • Развитие LLM и R&D: Подготовка данных и полный цикл дообучения открытых языковых моделей под специфику терминологии кибербеза. Формирование гипотез и проведение A/B тестирования различных архитектур.
  • Разработка специализированных SLM (Small Language Models): Подготовка данных, дистилляция знаний и дообучение компактных моделей для перевода естественного языка в структурированные запросы (Text-to-RQL / Text-to-SQL).
  • Построение логики RAG-систем: Проектирование архитектуры умного поиска (семантический чанкинг, гибридный поиск, Reranking) по корпоративным базам знаний, логам и инцидентам.
  • NLP и извлечение сущностей (NER): Обучение легковесных моделей для анализа неструктурированных данных (например: отчеты Threat Intelligence) и автоматического извлечения индикаторов сущностей различных типов.
  • Проектирование логики AI-агентов: Создание графов рассуждений (сценариев поведения), настройка Tool-calling и системных промптов для мультиагентных систем помощи аналитикам SOC.
  • Работа с данными: Проведение разведочного анализа (EDA), очистка и разметка сложных массивов данных (в том числе сырых логов).
  • Классическое машинное обучение: Применение классических алгоритмов машинного обучения для решения задач классификации/регрессии, где использование LLM избыточно

Ожидаем от тебя:

  • Уверенное владение Python (Pandas, NumPy, PyTorch) и умение писать оптимизированный код для проведения ML-экспериментов.
  • Глубокое понимание архитектуры Transformer.
  • Опыт оценки качества разрабатываемых систем машинного обучения (понимание метрик Recall@K, Precision, NDCG).
  • Опыт решения задач NLP (NER, классификация текстов) с использованием BERT-подобных моделей или LLM.
  • Уверенная работа с векторными БД и алгоритмами гибридного поиска.
  • Практический опыт подготовки данных и полного цикла дообучения языковых моделей (как больших LLM через современные методы PEFT: LoRA, QLoRA, DoRA, так и узкоспециализированных SLM для задач структурированной генерации формата JSON/RQL).
  • Сильная математическая база, понимание статистики и знание классических ML-алгоритмов.
  • Высшее профильное образование (Искусственный интеллект / Машинное обучение / Математика / Компьютерные науки).

Будет плюсом:

  • Понимание предметной области информационной безопасности.
  • Практический опыт проектирования графов состояний и логики для AI-агентов (LangGraph или аналоги).

Мы предлагаем:

  • Удаленный формат работы;
  • Достойную оплату труда, соответствующую профессиональному уровню и компетенциям;
  • Статус аккредитованной ИТ-компании со всеми преимуществами;
  • ДМС со стоматологией и госпитализацией по всей России, страхование от несчастного случая, полис ВЗР для поездок за границу, ветеринарная поддержка;
  • 100% компенсацию больничного, +10 дополнительных дней в году на отгул по болезни;
  • Регулярный обмен обратной связью по системе полугодового Performance Review;
  • Возможности для обучения и профессионального развития: корпоративную библиотеку, менторство, внутренние митапы по обмену опытом, практику публичных выступлений, возможность участвовать в создании контента для профессиональных сообществ;
  • Программу корпоративных скидок и привилегий;
  • Развитую корпоративную культуру: открытую коммуникацию, онлайн и офлайн встречи, клубы по интересам, спортивные активности и поддержку инициатив сотрудников.

Несмотря на быстрый рост, мы основательно подходим к подбору специалистов, поэтому нам удалось собрать профессиональную и сплоченную команду.

Присоединяйся к нам!