Senior Data Engineer
Местоположение: Удаленно Тип: Полный рабочий день
**Мы рассматриваем кандидатов, проживающих только в Латинской Америке
О нас
В tapouts мы верим в безграничный потенциал каждого ребенка. Наша миссия выходит за рамки обучения навыкам; мы посвящены воспитанию эмоционального и психологического благополучия следующего поколения. Представьте, что вы часть команды, которая меняет жизни миллиона детей и их семей. Присоединяясь к tapouts, вы не просто получаете работу, а используете свои таланты для глубоко вознаграждающей цели.
О роли
Мы ищем старшего инженера по данным (Senior Data Engineer) в нашу растущую команду данных. В этой роли вы будете отвечать за проектирование, создание и поддержку масштабируемой инфраструктуры данных, которая обеспечивает работу нашей аналитики, инициатив в области искусственного интеллекта и бизнес-операций.
Это практическая роль для того, кто процветает в быстро меняющейся среде, мыслит как архитектор платформ и увлечен созданием важных систем данных.
Ключевые обязанности
- Проектирование, создание и поддержка надежных, масштабируемых конвейеров данных (пакетных и в реальном времени/потоковых).
- Проектирование и разработка панелей мониторинга (dashboards), которые отображают ключевые бизнес-метрики и позволяют принимать стратегические, основанные на данных решения.
- Разработка и оптимизация сложных SQL-запросов, хранимых процедур и моделей данных.
- Написание чистого, производственного кода на Python для сбора, преобразования и автоматизации данных.
- Создание и управление облачной инфраструктурой данных на AWS, GCP или Azure.
- Внедрение и поддержка архитектур data lakehouse (например, Delta Lake, Apache Iceberg).
- Поддержка ML-рабочих процессов, включая инжиниринг признаков, конвейеры обучения моделей и интеграцию MLOps.
- Обеспечение качества данных, управления ими и отслеживания происхождения (lineage) всех активов данных.
- Сотрудничество с специалистами по данным (data scientists) и аналитиками для предоставления надежных, хорошо документированных наборов данных.
- Мониторинг производительности конвейеров, устранение неполадок и оптимизация затрат и эффективности.
- Внесение вклада в разработку внутренних инструментов и фреймворков платформы данных.
- Применение лучших практик управления данными и обеспечение соответствия нормам конфиденциальности данных (GDPR, LGPD).
Что мы ищем
- Мышление, ориентированное на платформу — вы мыслите шире отдельных конвейеров и учитываете владение, надежность и долгосрочную поддерживаемость.
- Подход, основанный на данных — вы используете метрики для оценки состояния конвейера и постоянного улучшения.
- Отличные коммуникативные навыки — вы можете сотрудничать с техническими и нетехническими заинтересованными сторонами.
- Комфорт в работе в неопределенных, быстро меняющихся средах и привнесение структуры в хаос.
- Страсть к непрерывному обучению — вы следите за новейшими инструментами и тенденциями в области инженерии данных.
Обязательно:
- 5+ лет опыта работы в инженерии данных или смежной области.
- Продвинутый английский язык.
- Уверенное владение SQL — написание сложных запросов, оптимизация производительности и моделирование данных.
- Уверенное владение Python — создание ETL/ELT конвейеров, написание скриптов и автоматизация.
- Опыт работы с облачными платформами: AWS, GCP или Azure.
- Практический опыт работы с инструментами оркестрации данных (Apache Airflow, Prefect или аналогичными).
- Опыт работы с фреймворками для обработки больших данных (Apache Spark, Kafka, Flink или аналогичными).
- Знакомство с решениями для хранения данных (Snowflake, BigQuery, Redshift или аналогичными).
- Глубокое понимание принципов моделирования данных, проектирования схем и архитектуры данных.
Желательно:
- Опыт работы с dbt (data build tool) и современной экосистемой данных (modern data stack).
- Знакомство со стриминговыми и событийно-ориентированными архитектурами.
- Знание MLOps и поддержки конвейеров ИИ.
- Опыт работы с data mesh или разработкой платформ данных (data platform engineering).
- Знакомство с фреймворками и инструментами управления данными (отслеживание происхождения данных, каталогизация данных).
tapouts стремится создавать разнообразную среду и гордится тем, что является работодателем, предоставляющим равные возможности. Все квалифицированные кандидаты будут рассмотрены независимо от расы, цвета кожи, религии, пола, сексуальной ориентации, национального происхождения, генетики, инвалидности или возраста.
Присоединяйтесь к нам в нашей миссии по предоставлению детям социальных и эмоциональных навыков, необходимых им для успеха!