Team.Inno / Фабрика инноваций и решений

Senior MLOps / DevOps Engineer

Не указана
  • Минск
  • От 3 до 6 лет
Team.Inno – одна из наиболее опытных белорусских компаний в области полного цикла разработки, внедрения и поддержки программного обеспечения, бизнес-анализа, дизайна, тестирования и управления проектами

За 18+ лет мы реализовали более 1600 проектов в разных отраслях для заказчиков из США, Канады, Великобритании, Германии, Франции, Италии, Японии и других стран. Наша команда специализируется на 40+ бизнес-доменах, включая Artificial Intelligence, Machine Learning, Augmented & Virtual Reality.

Сейчас Team.Inno объединяет 3500+ специалистов, которые работают в офисах компании в Беларуси, Польше, Литве, Грузии и Германии. Мы постоянно ищем опытных и начинающих специалистов, а с 2025 предлагаем обучение на бесплатных онлайн-курсах для всех, кто хочет начать карьеру в IT.

У нас можно пробовать себя на проектах разного масштаба, менять направления и выбирать карьерные треки. Присоединяйся!

Чем предстоит заниматься:

  • Проектирование, развертывание и поддержка отказоустойчивой инфраструктуры для платформ машинного обучения и конвейеров данных (Python, SQL) на базе клаудов (Azure, AWS, GCP) или on-premises решений;
  • Внедрение процессов управления жизненным циклом (ALM) для ML-моделей, автоматизация процессов обучения, версионирования и деплоя (MLflow, Kubeflow, ClearML или аналогичные платформы);
  • Обеспечение надежности, масштабируемости и высокой доступности MLOps-инфраструктуры;
  • Опыт работы с Data Analytics & Data Analysis(Работа с Databricks);
  • Проектирование и управление распределенными вычислительными средами (bare metal, VM, private/public cloud);
  • Контейнеризация ML-сервисов и приложений с использованием Docker и Kubernetes, обеспечение их безопасного вывода в продакшен;
  • Автоматизация развертывания инфраструктуры и конфигурации кластеров с помощью подходов IaC (Terraform, Bicep, и др.);
  • Разработка, внедрение и поддержка надежных CI/CD-пайплайнов (GitLab CI, GitHub Actions, Jenkins, Azure DevOps);
  • Настройка комплексного мониторинга и observability (логирование, метрики, дашборды) для контроля задержек и состояния кластеров;
  • Диагностика узких мест производительности, устранение сбоев на уровне узлов и сети, проведение Root Cause Analysis (RCA) в рамках управления инцидентами.

Наши ожидания:

  • Infrastructure & IaC: Управление серверной/облачной инфраструктурой (Public/Private), IaC-инструментами (Terraform, Bicep и др.), Docker и Kubernetes;
  • CI/CD: Проектирование и поддержка CI/CD в продакшен-средах;
  • MLOps / ALM: Развертывание и работа с MLflow, Kubeflow, ClearML или аналогичными платформами;
  • Incident Management: Опыт расследования причин сбоев (RCA) и стабилизации критических систем;
  • Сильный бэкграунд в Linux системах (RHEL/Rocky/SLES);
  • Уверенное владение Python и Bash или PowerShell для автоматизации;
  • Опыт работы с реляционными БД (PostgreSQL), сетевыми файловыми системами (NFS) и объектными хранилищами (S3, Blob-совместимыми);
  • Знание английского языка на уровне Intermediate+ (для работы с документацией и международными командами).

Будет плюсом:

  • Глубокий опыт работы с HPC-планировщиками (PBS Professional, Torque, Slurm);
  • Навыки связывания традиционных HPC-систем с современными cloud-native платформами (Kubernetes, MLOps-стеки) и настройка гибридного масштабирования (cloud bursting) в публичные или частные облака;
  • Понимание MPI-нагрузок (OpenMPI, MPICH) и планирования GPU (стек NVIDIA, концепции MIG/MPS);
  • Опыт работы с параллельными файловыми системами (строго предпочтителен Lustre);
  • Опыт управления конфигурациями (Ansible, Puppet или аналоги).

Soft Skills:

  • Сильный аналитический склад ума с фокусом на практическую реализацию;
  • Умение переводить бизнес-требования в масштабируемые технические решения;
  • Навыки кросс-функционального взаимодействия (с дата-саентистами, разработчиками и ИТ-эксплуатацией).

Мы предлагаем:

  • Большой пул разноплановых проектов в таких сферах, как FinTech, Medicine, Entertainment, eCommerce, Gaming, Artificial Intelligence и пр.;
  • Индивидуальные карты роста и регулярный пересмотр условий (роли на проекте, уровня ЗП);
  • Формат работы: офис;
  • Просторные и комфортные рабочие места;
  • Подробный онбординг: знакомство с командой, процессами и правилами, экскурсия по офису, welcome card;
  • Уютные кухни, игровые комнаты, коворкинги, лаунж-зоны.

Дополнительные бонусы:

  • Добровольное медицинское страхование;
  • Cкидки у компаний-партнеров (от пиццерий и книжных до магазинов бытовой техники).

Если ты ищешь реальные возможности реализовать себя, управлять профессиональным и карьерным ростом – будем рады видеть тебя в нашей дружной команде!

Создание рабочего места планируется в перспективе.