Таймвэб.Клауд

Senior System Administrator Cloud DBaaS

Не указана

Санкт-Петербург
От 1 года до 3 лет

PostgreSQL
MySQL
Redis
MongoDB
Clickhouse
RabbitMQ
Apache Kafka
Linux
Python
Prometheus
Grafana
Vector NTI
IPTables
GitLab CI

Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, APPS Platform, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети. Наша цель — создавать мощные и технологичные продукты, за которыми стоит сложная и интересная разработка.

Один из ключевых продуктов — платформа Database as a Service (DBaaS). Мы предоставляем клиентам managed-инстансы популярных СУБД и очередей: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka Мы не используем готовые решения — мы пишем свою логику оркестрации, автоматизируем установку и масштабирование кластеров.

Мы ищем инженера, который хочет работать со сложной инфраструктурой, разбираться в устройстве разных тип баз данных, их оптимизации и автоматизации управления.

Что предстоит делать:

Развитие платформы
Автоматизировать развёртывание и управление тысячами инстансов баз данных с помощью симбиоза собственного control plane и SaltStack.
Проектировать архитектуру DBaaS: выбирать и внедря️ подходы к резервному копированию (WAL-G, pgBackRest), репликации, failover'у и кластеризации.
Участвовать в создании новых продуктов вокруг баз данных: от идеи до продакшна (новые версии СУБД, типы инстансов, дополнительные движки).

Работа с кодом и автоматизацией

Писать и поддерживать Salt модули (states, pillars) для развёртывания и конфигурации СУБД и очередей.
Разрабатывать скрипты автоматизации на Python (основной язык для логики управления жизненным циклом баз).
Пакетировать ПО: сборка deb-пакетов для внутренних нужд и кастомных версий СУБД.

Администрирование и надёжность

Обеспечивать 24/7 доступность сервисов DBaaS и инфраструктурных компонентов: мониторинг, резервное копирование, управление кластерами.
Развивать мониторинг и алертинг: работа с Prometheus, VictoriaMetrics, экспортерами (Postgres Exporter, MySQL Exporter, и др.), настройка дашбордов в Grafana.
Работать с логами: централизованный сбор через Vector, хранение в VictoriaLogs (или аналогичной системе), анализ и алертинг по логам.
Расследовать инциденты на уровне компонентов СУБД, ядра Linux и сети.
Автоматизировать рутинные операции через CI/CD и скрипты.

Мы ждём от тебя

Hard skills

Базы данных и очереди
Знание отличия синхронной и асинхронной репликации, шардирование
Глубокое понимание устройства хотя бы одной из реляционных СУБД (PostgreSQL / MySQL): процессы, журналы, буферы, изоляция транзакций, бэкапы и PITR.
Опыт администрирования production-инстансов СУБД и очередей (не менее 4-х из списка: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka) — настройка, оптимизация запросов, тюнинг, резервное копирование, репликация.

Linux

Экспертный уровень Linux: понимание cgroups, namespaces, systemd, работа с дисками и файловыми системами, умение расследовать проблемы на уровне ОС (лаги, утечки, I/O).
Опыт сборки deb-пакетов
Понимание работы systemd на уровне написания своих юнитов.

Сеть

Уверенное знание сетевого стека Linux: iptables/nftables, сетевые namespace'ы, тюнинг сетевых параметров для баз данных, диагностика сетевых проблем.
Vlan/Vxlan/BGP

Инструменты автоматизации

Опыт работы с системами управления конфигурациями: обязательное знание SaltStack (states, pillars, reactor) или Ansible с готовностью перейти на Salt.
Опыт написания скриптов на Python (уровень: автоматизация рутинных задач, написание вспомогательных сервисов).
Понимание CI/CD (GitLab CI или аналоги) для автоматизации развёртываний.

Мониторинг и логи

Опыт работы с Prometheus и экспортерами, VictoriaMetrics, Grafana.
Понимание архитектуры сбора логов: Vector/Fluent Bit, централизованное хранение и анализ.

Виртуализация и контейнеризация

Работа с виртуализацией на уровне хоста (KVM/QEMU): управление выделением ресурсов, расследование проблем производительности и эффекта "шумных соседей".
Контейнеризация: глубокое понимание работы Docker и контейнерной изоляции (namespaces, cgroups), сборка и оптимизация образов, безопасность контейнеров.

Soft skills

Готовность аргументировать и отстаивать свои технические решения.
Системное мышление и умение видеть картину целиком: от железа и сети до клиентского опыта.
Ответственность за надёжность платформы и умение работать в режиме инцидентов.

Будет огромным плюсом

Глубокое знание СУБД

Опыт настройки асинхронной и синхронной репликации, patroni, haproxy/keepalived для PostgreSQL.
Опыт работы с шардированием (Citus, ClickHouse sharding, MongoDB sharding)..

Разработка

Опыт написания операторов для Kubernetes на Go (если планируется миграция или интеграция).
Опыт создания Salt-модулей на Python.

Инфраструктурные сервисы

Опыт работы с HashiCorp Vault / OpenBao для управления секретами.
Опыт администрирования Harbor (если используются кастомные образы).

Бэкапы

Опыт работы с WAL-G, pgBackRest, XtraBackup.

Наш стек

Платформа: Виртуальные машины (OpenStack/KVM), собственный control plane на SaltStack
СУБД и очереди: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Apache Kafka
Бэкапы: WAL-G, pgBackRest, xtrabackup, инструменты дампа
Мониторинг и логи: Prometheus, VictoriaMetrics, VictoriaLogs, Vector, Grafana, экспортеры
CI/CD: GitLab CI
Языки: Python (основной), Go (вспомогательный), Bash
Управление конфигурациями: SaltStack

Почему вам стоит откликнуться

Масштаб и сложность: Тысячи клиентских баз данных, собственный control plane, высокие нагрузки.
Многообразие технологий: Ты будешь работать с восемью различными движками (SQL, NoSQL, очереди) — это уникальный опыт.
Влияние на продукт: Ты участвуешь в создании новых фич и сервисов, а не просто поддерживаешь существующее.
Развитие в Python: Основной язык команды — Python, ты будешь писать логику автоматизации.
Сильная команда: Мы собираем инженеров, которым интересно копать глубоко и строить сложные системы.

Что мы предлагаем:

Амбициозный и интересный продукт;
Официальное оформление в аккредитованной IT компании со всеми вытекающими преимуществами;
Заряженная команда из сильных специалистов;
ДМС, компенсация спорта и питания;
8 дополнительных day-off в год - по 2 каждый квартал.

Для быстрой связи укажите @ своего телеграма в сопроводительном письме :)

Источник вакансии

Вернуться, к списку вакансий