ЦРТ | Группа компаний

DBA Performance Engineer (PostGIS, DWH, Geospatial)

Не указана
  • Санкт-Петербург
  • Более 6 лет

ЦРТ - российская аккредитованная продуктовая IT-компания. Являемся лидерами в разработке систем для распознавания и синтеза речи, идентификации личности по голосу и изображению. Наши продукты внедрены в крупных корпорациях по всей России. 75+ стран присутствия продукта на стороне клиента.

Ключевые задачи:

  • Проектировать и оптимизировать слой хранения и аналитической обработки данных;
  • Работать с пространственными данными как с одним из ключевых типов данных;
  • Разрабатывать и оптимизировать схемы данных, индексы, партиционирование, стратегии хранения и архивации;
  • Участвовать в построении кубов / витрин / аналитических моделей для временных рядов, геоданных и поиска аномалий;
  • Исследовать и внедрять подходящие СУБД и движки под разные типы нагрузки: транзакционные, аналитические, time-series, geospatial, near real-time;
  • Совместно с командой проектировать последовательности обработки данных с учетом SLA по задержкам, пропускной способности и стоимости владения;
  • Формировать инженерные стандарты по работе с данными, наблюдаемости и планированию мощностей.

Что для нас важно:

  • Сильный практический опыт с зрелой реляционной СУБД на уровне внутренней механики производительности;
  • Хорошее понимание PostGIS(или аналог) и особенностей работы с геопространственными индексами и запросами;
  • Опыт проектирования DWH / Lakehouse / аналитических витрин / кубов данных;
  • Умение оптимизировать SQL, массовые загрузки, репликацию, партиционирование;
  • Понимание OLTP/OLAP паттернов и выбора технологий под тип нагрузки;
  • Опыт работы с Linux production-средой;
  • Базовое или уверенное понимание Kafka и потоковых пайплайнов как источника данных;
  • Желателен опыт работы с временными рядами, поиском аномалий, колоночными СУБД и распределенными движками запросов.

Будет плюсом

  • Опыт с ClickHouse, Greenplum, Trino/Presto, TimescaleDB, Elasticsearch/OpenSearch, Cassandra, Pinot, Druid или аналогами;
  • Опыт эксплуатации высоконагруженных систем и терабайтных массивов данных;
  • Понимание того, как готовить данные для целевых сценариев ML, LLM и CV.