Таймвэб.Клауд
Senior System Administrator Cloud DBaaS
- PostgreSQL
- MySQL
- Redis
- MongoDB
- Clickhouse
- RabbitMQ
- Apache Kafka
- Linux
- Python
- Prometheus
- Grafana
- Vector NTI
- IPTables
- GitLab CI
Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, APPS Platform, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети. Наша цель — создавать мощные и технологичные продукты, за которыми стоит сложная и интересная разработка.
Один из ключевых продуктов — платформа Database as a Service (DBaaS). Мы предоставляем клиентам managed-инстансы популярных СУБД и очередей: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka Мы не используем готовые решения — мы пишем свою логику оркестрации, автоматизируем установку и масштабирование кластеров.
Мы ищем инженера, который хочет работать со сложной инфраструктурой, разбираться в устройстве разных тип баз данных, их оптимизации и автоматизации управления.
Что предстоит делать:
- Развитие платформы
-
Автоматизировать развёртывание и управление тысячами инстансов баз данных с помощью симбиоза собственного control plane и SaltStack.
-
Проектировать архитектуру DBaaS: выбирать и внедря️ подходы к резервному копированию (WAL-G, pgBackRest), репликации, failover'у и кластеризации.
-
Участвовать в создании новых продуктов вокруг баз данных: от идеи до продакшна (новые версии СУБД, типы инстансов, дополнительные движки).
Работа с кодом и автоматизацией
-
Писать и поддерживать Salt модули (states, pillars) для развёртывания и конфигурации СУБД и очередей.
-
Разрабатывать скрипты автоматизации на Python (основной язык для логики управления жизненным циклом баз).
-
Пакетировать ПО: сборка deb-пакетов для внутренних нужд и кастомных версий СУБД.
Администрирование и надёжность
-
Обеспечивать 24/7 доступность сервисов DBaaS и инфраструктурных компонентов: мониторинг, резервное копирование, управление кластерами.
-
Развивать мониторинг и алертинг: работа с Prometheus, VictoriaMetrics, экспортерами (Postgres Exporter, MySQL Exporter, и др.), настройка дашбордов в Grafana.
-
Работать с логами: централизованный сбор через Vector, хранение в VictoriaLogs (или аналогичной системе), анализ и алертинг по логам.
-
Расследовать инциденты на уровне компонентов СУБД, ядра Linux и сети.
-
Автоматизировать рутинные операции через CI/CD и скрипты.
Мы ждём от тебя
Hard skills
- Базы данных и очереди
-
Знание отличия синхронной и асинхронной репликации, шардирование
-
Глубокое понимание устройства хотя бы одной из реляционных СУБД (PostgreSQL / MySQL): процессы, журналы, буферы, изоляция транзакций, бэкапы и PITR.
-
Опыт администрирования production-инстансов СУБД и очередей (не менее 4-х из списка: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka) — настройка, оптимизация запросов, тюнинг, резервное копирование, репликация.
Linux
-
Экспертный уровень Linux: понимание cgroups, namespaces, systemd, работа с дисками и файловыми системами, умение расследовать проблемы на уровне ОС (лаги, утечки, I/O).
-
Опыт сборки deb-пакетов
-
Понимание работы systemd на уровне написания своих юнитов.
Сеть
-
Уверенное знание сетевого стека Linux: iptables/nftables, сетевые namespace'ы, тюнинг сетевых параметров для баз данных, диагностика сетевых проблем.
-
Vlan/Vxlan/BGP
Инструменты автоматизации
-
Опыт работы с системами управления конфигурациями: обязательное знание SaltStack (states, pillars, reactor) или Ansible с готовностью перейти на Salt.
-
Опыт написания скриптов на Python (уровень: автоматизация рутинных задач, написание вспомогательных сервисов).
-
Понимание CI/CD (GitLab CI или аналоги) для автоматизации развёртываний.
Мониторинг и логи
-
Опыт работы с Prometheus и экспортерами, VictoriaMetrics, Grafana.
-
Понимание архитектуры сбора логов: Vector/Fluent Bit, централизованное хранение и анализ.
Виртуализация и контейнеризация
-
Работа с виртуализацией на уровне хоста (KVM/QEMU): управление выделением ресурсов, расследование проблем производительности и эффекта "шумных соседей".
-
Контейнеризация: глубокое понимание работы Docker и контейнерной изоляции (namespaces, cgroups), сборка и оптимизация образов, безопасность контейнеров.
Soft skills
-
Готовность аргументировать и отстаивать свои технические решения.
-
Системное мышление и умение видеть картину целиком: от железа и сети до клиентского опыта.
-
Ответственность за надёжность платформы и умение работать в режиме инцидентов.
Будет огромным плюсом
Глубокое знание СУБД
-
Опыт настройки асинхронной и синхронной репликации, patroni, haproxy/keepalived для PostgreSQL.
-
Опыт работы с шардированием (Citus, ClickHouse sharding, MongoDB sharding)..
Разработка
-
Опыт написания операторов для Kubernetes на Go (если планируется миграция или интеграция).
-
Опыт создания Salt-модулей на Python.
Инфраструктурные сервисы
-
Опыт работы с HashiCorp Vault / OpenBao для управления секретами.
-
Опыт администрирования Harbor (если используются кастомные образы).
Бэкапы
-
Опыт работы с WAL-G, pgBackRest, XtraBackup.
Наш стек
-
Платформа: Виртуальные машины (OpenStack/KVM), собственный control plane на SaltStack
-
СУБД и очереди: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Apache Kafka
-
Бэкапы: WAL-G, pgBackRest, xtrabackup, инструменты дампа
-
Мониторинг и логи: Prometheus, VictoriaMetrics, VictoriaLogs, Vector, Grafana, экспортеры
-
CI/CD: GitLab CI
-
Языки: Python (основной), Go (вспомогательный), Bash
-
Управление конфигурациями: SaltStack
Почему вам стоит откликнуться
-
Масштаб и сложность: Тысячи клиентских баз данных, собственный control plane, высокие нагрузки.
-
Многообразие технологий: Ты будешь работать с восемью различными движками (SQL, NoSQL, очереди) — это уникальный опыт.
-
Влияние на продукт: Ты участвуешь в создании новых фич и сервисов, а не просто поддерживаешь существующее.
-
Развитие в Python: Основной язык команды — Python, ты будешь писать логику автоматизации.
-
Сильная команда: Мы собираем инженеров, которым интересно копать глубоко и строить сложные системы.
Что мы предлагаем:
- Амбициозный и интересный продукт;
-
Официальное оформление в аккредитованной IT компании со всеми вытекающими преимуществами;
-
Заряженная команда из сильных специалистов;
-
ДМС, компенсация спорта и питания;
-
8 дополнительных day-off в год - по 2 каждый квартал.
Для быстрой связи укажите @ своего телеграма в сопроводительном письме :)