Инженер надежности сайтов (SRE)
Мы ищем Инженера надежности сайтов (SRE) для работы в нашей команде на Кипре (на месте) или удаленно. В этой роли вы будете отвечать за поддержание стабильности и надежности нашей производственной среды.
Обязанности:
- Гарантировать стабильность производственной и инфраструктуры для разработки
- Разрабатывать и улучшать системы мониторинга, оповещения и отслеживания (метрики, логи, трассировка)
- Настраивать и оптимизировать системы метрик и логирования
- Анализировать инциденты и предотвращать их повторение
- Работать с оповещениями и повышать их качество
- Повышать надежность услуг и устойчивость к сбоям
- Оптимизировать производительность и стабильность системы
Ключевые компетенции:
- Отличное понимание Linux
- Опыт работы в роли SRE / DevOps / Системного инженера
- Прочный опыт работы с инструментами мониторинга и оповещения (Prometheus, Grafana или аналоги)
- Понимание отслеживания (метрики, логи, трассировка)
- Опыт работы с Kubernetes и контейнеризацией
- Опыт анализа инцидентов и устранения проблем в производственной среде
- Навыки автоматизации (Bash, Python)
- Понимание сетей, производительности и устойчивости к сбоям
- Опыт работы с GCP будет преимуществом
Мы предлагаем:
- Удаленная работа или работа из нашего офиса в Лимасол
- Компенсация за уроки английского или греческого языка
- Медицинская страховка (только для Кипра)
- Обеды в офисе (только для Кипра)
- Гибкое начало рабочего дня