Navio

Инженер данных в команду распознавания окружения

Не указана
  • Москва
  • От 3 до 6 лет
  • Python
  • SQL
  • Dagster
  • Clickhouse
  • Deep Learning
  • Spark
  • Английский — B1 — Средний

О команде:

Команда распознавания окружения решает задачи обучения нейронных сетей для распознавания в самых разных сценариях. Мы твёрдо знаем: создать эффективный нейросетевой алгоритм без качественных данных невозможно. Именно поэтому мы строим собственную инфраструктуру для подготовки, обработки и интеграции данных во фреймворки обучения моделей распознавания.

В нашу команды мы ищем специалиста, который хорошо знаком с устройством нейронных сетей и понимает реальные потребности инженеров в области глубокого обучения — ведь именно с ними предстоит тесно взаимодействовать. Нам нужен человек, который поможет разрабатывать пайплайны подготовки данных, заниматься их предобработкой и сбором. Работа предполагает взаимодействие с большими объёмами технических данных, использование различных сервисов для работы с ними и написание алгоритмов обработки на Python.

Чем предстоит заниматься:

  • Проектирование и разработка пайплайнов для сборки, обработки и доставки данных;
  • Подготовка и форматирование данных для обучения нейросетевых моделей с учётом требований инженеров в области глубокого обучения;
  • Создание инструментов для эффективной работы с данными;
  • Построение систем мониторинга данных и контроля процессов их обработки.

Что мы ждем от кандидата:

  • Разработка на языке Python, хорошее знание SQL (на уровне джойнов);
  • Опыт работы со Spark;
  • Опыт обработки данных с использованием Python (Pandas/Polars);
  • Опыт работы с задачами поддержки команд машинного/глубокого обучение.

Будет плюсом:

  • Опыт работы с Clickhouse;
  • Опыт работы с данными для компьютерного зрения;
  • Опыт работы с Dagster.