Site Reliability Engineer (SRE)
Компания: Apicworld
Местоположение: Лимассол, Кипр
Тип занятости: FULL_TIME
Мы ищем Site Reliability Engineer (SRE), который присоединится к нашей команде на Кипре (офис) или будет работать удаленно. На этой должности вы будете отвечать за поддержание стабильности и надежности нашей продакшн-среды.
Обязанности:
- Обеспечение стабильности продакшн и девелоперской инфраструктуры
- Разработка и улучшение систем мониторинга, оповещения и наблюдаемости (метрики, логи, трассировка)
- Конфигурирование и оптимизация систем метрик и логирования
- Анализ инцидентов и предотвращение их повторения
- Работа с оповещениями и улучшение их качества
- Повышение надежности сервисов и отказоустойчивости
- Оптимизация производительности и стабильности систем
Ключевые компетенции:
- Глубокое понимание Linux
- Опыт работы в качестве SRE / DevOps / System Engineer
- Уверенный опыт работы с инструментами мониторинга и оповещения (Prometheus, Grafana или аналогичные)
- Понимание наблюдаемости (метрики, логи, трассировка)
- Опыт работы с Kubernetes и контейнеризацией
- Опыт анализа инцидентов и устранения неполадок в продакшне
- Навыки автоматизации (Bash, Python)
- Понимание сетевых технологий, производительности и отказоустойчивости
- Опыт работы с GCP будет плюсом
Мы предлагаем:
- Удаленная работа или работа из нашего офиса в Лимассоле
- Компенсация уроков английского или греческого языка
- Медицинская страховка (только для Кипра)
- Офисные обеды (только для Кипра)
- Гибкое начало рабочего дня