Senior Backend Engineer
Компания: AGIMA
Тип занятости: FULL_TIME
Местоположение: Ближний Восток, Россия, Беларусь, Украина, Северная Корея.
Контракт: 1 год
О роли
Мы ищем backend-инженера, который будет создавать и эксплуатировать системы, выводящие Generative AI для понимания документов + чертежей (текст и изображения) в продакшн. Эта роль фокусируется на проектировании масштабируемых микросервисов, API и конвейеров инференса, которые вызывают фундаментальные модели (сегодня: Bedrock на AWS) и делают возможности этих моделей надежными и готовыми к продакшну.
Что вы будете курировать
- Проектирование и реализация backend-микросервисов и API, интегрирующихся с фундаментальными моделями для инференса при обработке документов + чертежей.
- Создание масштабируемых стратегий маршрутизации запросов, кеширования и очередей для трафика инференса (обработка всплесков и пиковых нагрузок).
- Реализация CI/CD и наблюдаемости на уровне сервиса для конвейеров инференса (логирование, метрики, оповещения).
- Развертывание и эксплуатация сервисов в Kubernetes (deployment, rollout, health checks); администрирование кластера осуществляется платформой/SRE.
- Интеграция с сервисами AWS и обеспечение правильного управления IAM/минимальных привилегий для доступа от сервиса к сервису.
- Сотрудничество с data scientists / ML-инженерами (они отвечают за обучение моделей; вы отвечаете за интеграцию в продакшн).
- Помощь в формировании операционных практик для продакшн-инференса (область ответственности по вызовам в нерабочее время будет уточнена; ожидается поддержка реагирования на инциденты на уровне сервиса).
Обязательно (основные требования)
- 5+ лет опыта создания продакшн-backend-систем / API на Python.
- Большой опыт проектирования и эксплуатации распределенных микросервисов (масштабируемость, маршрутизация, кеширование, отказы).
- Практический опыт работы с AWS и интеграции внешних API моделей (сегодня мы в основном вызываем фундаментальные модели через Bedrock).
- Опыт продакшн-развертывания сервисов в Kubernetes (вы развертываете и эксплуатируете приложения там; платформенная команда управляет инфраструктурой кластера).
- Опыт CI/CD (требуется знакомство с GitHub Actions).
- Твердое практическое понимание IAM и основных принципов облачной безопасности (минимальные привилегии, сервисные роли).
- Демонстрируемый опыт работы с логированием/наблюдаемостью (структурированные логи, метрики, трейсы) и проектирования конвейеров для последующего анализа.
- Опыт работы с Terraform или другими инструментами IaC.
- Четкая, проверяемая коммуникация — способность конкретно объяснять решения по дизайну систем и прошлую работу.
Предпочтительно (желательно)
- Предварительный опыт интеграции GenAI / LLM (Bedrock, маршрутизация API, выбор модели)
- Опыт работы с конвейерами обработки изображений/документов (OCR, предварительная обработка изображений, парсинг технических чертежей)
- Опыт работы с паттернами оркестрации инференса (асинхронные воркеры, пакетная обработка, оркестрация GPU) или знакомство с рабочими нагрузками на основе GPU
- Знакомство с инструментами жизненного цикла ML (MLflow, реестры моделей, отслеживание экспериментов)
- Опыт работы с сервисами реального времени и пакетного инференса, feature stores или продакшн-использование SageMaker