Мособлгаз

Data Engineer

Не указана
  • Москва
  • От 3 до 6 лет
  • Python
  • GitHub
  • SQL
  • NoSQL
  • pandas
  • Apache Airflow
  • PostgreSQL
  • ORACLE
  • Power BI

АО «Мособлгаз» — одна из крупнейших газораспределительных компаний России — ищет Data инженера. Вам предстоит работать с реальными операционными и транзакционными данными масштабной инфраструктуры, строить ETL‑процессы и оптимизировать хранилища. Идеальный вариант для тех, кто хочет применить свои навыки в реальном секторе и увидеть влияние своей работы на бизнес.

Чем предстоит заниматься:

  • Собирать, обрабатывать и анализировать реальные данные из транзакционных систем, обеспечивать их качество и целостность.
  • Разрабатывать, внедрять и поддерживать ETL‑процессы (извлечение, трансформация и загрузка данных) для интеграции информации из разнородных источников.
  • Создавать и сопровождать витрины данных, структурируя информацию под конкретные бизнес‑задачи и запросы пользователей.
  • Оптимизировать архитектуру и производительность хранилищ данных в т.ч. настраивать индексы, партиционирование и способы хранения для ускорения запросов и снижения нагрузки на систему.
  • Взаимодействовать с командой аналитиков: уточнять требования к данным, согласовывать структуру витрин и отчётов, помогать в поиске и устранении проблем с данными.
  • Проектировать и поддерживать пайплайны данных (data pipelines), гарантируя надёжность, масштабируемость и отказоустойчивость процессов обработки.
  • Документировать процессы работы с данными: описывать схемы баз данных, ETL‑логику, интерфейсы обмена и правила трансформации.
  • Мониторить работу ETL‑процессов и хранилищ: выявлять узкие места, ошибки загрузки и задержки, оперативно устранять инциденты.
  • Участвовать в развитии стратегии работы с данными в компании: предлагать решения по улучшению качества данных, автоматизации процессов и внедрению новых инструментов.

Мы ждём, что вы:

  • Владеете SQL на продвинутом уровне: пишете сложные запросы, оптимизируете планы выполнения, работаете с оконными функциями, хранимыми процедурами и триггерами.
  • Уверенно программируете на Python для задач обработки данных: используете библиотеки SQLAlchemy, requests, pandas, polars, numpy и др., пишете скрипты автоматизации ETL.
  • Имеете практический опыт работы с ETL‑инструментами и оркестрацией процессов, в т. ч. с Apache Airflow (создаёте DAG, настраиваете сенсоры и операторы, управляете зависимостями задач).
  • Знаете принципы проектирования хранилищ данных (Data Warehouse) и витрин данных (Data Marts): знакомы с методологиями Kimball и Inmon, умеете строить схемы «звезда» и «снежинка».
  • Имеете опыт работы с BI‑системами (Tableau, Power BI, Looker и т. п.) и понимаете, как готовить данные для визуализации: создаёте семантические слои, метрики и дашборды совместно с аналитиками..
  • Умеете читать и проектировать схемы баз данных, работать с реляционными (MSSQl, PostgreSQL, MySQL, Oracle)
  • Обладаете навыками документирования технических решений и процессов, чётко формулируете мысли в устной и письменной коммуникации.
  • Готовы к непрерывному обучению: следите за трендами в области Data Engineering, изучаете новые инструменты и подходы к работе с данными.

Почему стоит к нам прийти:

  • Развитие. Мы компенсируем затраты на обучение по программам, которые нужны для работы:тренинги, семинары, курсы — поможем расти профессионально.
  • Забота о здоровье. После испытательного срока предоставляем ДМС (с софинансированием).
  • Комфорт на работе. На территории есть столовая,где можно вкусно пообедать, и корпоративный фитнес-клуб.
  • Для семьи. Детям сотрудников предоставляем путёвки в корпоративный лагерь.
  • Удобный путь на работу. Организован корпоративный транспорт от метро «Парк Победы».

Место работы: Рублёво-Успенское шоссе, 1-й километр, 1Б.
График: 5/2, с 09:00 до 18:00, в пятницу — до 16:45.

Присоединяйтесь к команде «Мособлгаза» — здесь вы сможете решать масштабные задачи и расти вместе с одной из ведущих компаний отрасли!