Обязанности:
- Автоматизация мониторинга платформ и достижение точности прогнозирования инцидентов
- Вывод показателей платформ и сервисов в единый контур мониторинга.
- Создание дашбордов (ошибки, скорость, нагрузка).
- Настройка политик оповещения (alerting), исключающих «шум», и внедрение предсказуемой аналитики для обнаружения аномалий.
- Создание инструментов и документации для администраторам и разработчиков.
- Стаж работы с системами мониторинга корпоративного уровня («Zabbix», «Prometheus» или др.).
- Умение работать и администрировать системы на базе Linux
- Умение писать скрипты для автоматизации (python, bash)
- Понимание принципов сбора логов и умение настраивать парсинг данных.
- Опыт работы с системой зонтичного мониторинга Pandora FMS
- Понимание того, как собирать метрики и логи в контейнеризированных средах (kubernates, docker).
- Умение работать с большими объемами данных в «MySQL» или «PostgreSQL» (индексы, партиционирование)
- Удалённый формат работы.
- Работу в сильной команде, где ценятся взаимопомощь и ориентация на результат;
- Постоянный рост: система грейдирования, индивидуальные планы развития, менторство;
- Обучение: мы оплачиваем участие в конференциях, тренингах, мастер-классах;
- Языковые курсы и огромная онлайн-библиотека;
- Программа релокации для иногородних сотрудников.