ЦРТ | Группа компаний

DBA Performance Engineer (PostGIS, DWH, Geospatial)

Не указана

Санкт-Петербург
Более 6 лет

ЦРТ - российская аккредитованная продуктовая IT-компания. Являемся лидерами в разработке систем для распознавания и синтеза речи, идентификации личности по голосу и изображению. Наши продукты внедрены в крупных корпорациях по всей России. 75+ стран присутствия продукта на стороне клиента.

Ключевые задачи:

Проектировать и оптимизировать слой хранения и аналитической обработки данных;
Работать с пространственными данными как с одним из ключевых типов данных;
Разрабатывать и оптимизировать схемы данных, индексы, партиционирование, стратегии хранения и архивации;
Участвовать в построении кубов / витрин / аналитических моделей для временных рядов, геоданных и поиска аномалий;
Исследовать и внедрять подходящие СУБД и движки под разные типы нагрузки: транзакционные, аналитические, time-series, geospatial, near real-time;
Совместно с командой проектировать последовательности обработки данных с учетом SLA по задержкам, пропускной способности и стоимости владения;
Формировать инженерные стандарты по работе с данными, наблюдаемости и планированию мощностей.

Что для нас важно:

Сильный практический опыт с зрелой реляционной СУБД на уровне внутренней механики производительности;
Хорошее понимание PostGIS(или аналог) и особенностей работы с геопространственными индексами и запросами;
Опыт проектирования DWH / Lakehouse / аналитических витрин / кубов данных;
Умение оптимизировать SQL, массовые загрузки, репликацию, партиционирование;
Понимание OLTP/OLAP паттернов и выбора технологий под тип нагрузки;
Опыт работы с Linux production-средой;
Базовое или уверенное понимание Kafka и потоковых пайплайнов как источника данных;
Желателен опыт работы с временными рядами, поиском аномалий, колоночными СУБД и распределенными движками запросов.

Будет плюсом

Опыт с ClickHouse, Greenplum, Trino/Presto, TimescaleDB, Elasticsearch/OpenSearch, Cassandra, Pinot, Druid или аналогами;
Опыт эксплуатации высоконагруженных систем и терабайтных массивов данных;
Понимание того, как готовить данные для целевых сценариев ML, LLM и CV.

Источник вакансии

Вернуться, к списку вакансий