Vallettasoftware - разработчик кастомного мобильного/веб-ПО в США и Европе. Наши команды реализуют ИТ-проекты различной сложности, включая разработку веб-сайтов и мобильных приложений, корпоративные системы и решения на основе искусственного интеллекта и машинного обучения (AI/ML).
Наша компания заняла место среди Чемпионов Clutch Fall 2025. Эти награды подтверждают, что мы входим в ТОП-15 компаний-разработчиков ИИ-агентов!
Мы — распределенная команда, вы можете работать из любой точки мира, кроме РФ и РБ, при условии обеспечения тишины, хорошего интернет-соединения, доступности и надлежащей рабочей обстановки.
Мы ищем Senior / Lead AI Engineer для создания готовых к эксплуатации ИИ-систем, где:
- LLM является основным уровнем решения
- Агентные рабочие процессы используются в качестве основного паттерна оркестрации
- Качество системы управляется посредством оценки
- Надежность, наблюдаемость и контроль затрат проектируются как часть архитектуры, а не добавляются позже
Это не бэкенд-инженер с функциями ИИ, и не промпт-инженер.
Это инженер, который знает, как создавать ИИ-нативные системы от начала до конца и доводить их до продакшена.
1. Жесткие требования
1.1. AI / LLM Системы
Обязательно:
- Реальный опыт разработки и внедрения LLM-систем в продакшен
- Опыт работы с API LLM: OpenAI / Anthropic / Gemini / аналогичные
- Разработка промптов (Prompt design)
- Структурированные выводы (Structured outputs)
- Инструментальное / функциональное вызывание (Tool / function calling)
- Выбор моделей и понимание компромиссов между моделями
1.2. Агентные системы
Обязательно:
- Опыт проектирования многоэтапных рабочих процессов
- Опыт разработки систем на основе агентов: одноагентные и/или многоагентные
- Оркестрация: планирование, выполнение, повторные попытки, резервное копирование, верификация
- Управление:
- Состоянием (State)
- Контекстом (Context)
- Памятью (Memory)
- Понимание, когда агентный подход необходим, а когда нет
- Понимание границ доверия в агентных системах
- Принцип наименьших привилегий для разрешений инструментов
- Защита от косвенных инъекций промптов через внешние данные (извлечение, результаты инструментов, внешние API)
1.3. Оценка и контроль качества
Обязательно:
- Создание конвейеров оценки (evaluation pipelines)
- Офлайн-оценка
- Сравнение версий промптов / моделей
- Метрики качества
- Подходы к онлайн-валидации / A/B-тестированию / циклам человеческого обзора
- Способность связать оценку с реальным качеством продукта
1.4. Управление контекстом и контроль галлюцинаций
Обязательно:
- Управление контекстом:
- Стратегии чанкинга (Chunking strategies)
- Оптимизация контекстного окна
- Паттерны памяти (Memory patterns)
- Контроль области поиска (Retrieval scope control)
- Методы снижения галлюцинаций:
- Заземление (Grounding)
- Поиск (Retrieval)
- Проверка с помощью инструментов (Tool-based verification)
- Ограничения (Constraints)
- Паттерны самопроверки / валидации (Self-check / validation patterns)
1.5. Продакшен / LLM Ops / Надежность
Обязательно:
- Повторные попытки / экспоненциальная задержка (Retries / exponential backoff)
- Обработка тайм-аутов (Timeout handling)
- Резервные варианты / маршрутизация моделей (Fallbacks / model routing)
- Деградированный режим / плавный отказ (Degraded mode / graceful failure)
- Обработка ограничений скорости (Rate-limit handling)
- Наблюдаемость (Observability):
- Задержка (Latency)
- Использование токенов (Token usage)
- Стоимость (Cost)
- Частота сбоев (Failure rate)
- Сигналы качества вывода (Output quality signals)
- Контроль затрат (Cost control)
- Мониторинг и отладка ИИ-систем в продакшене
- Обработка PII: фильтрация перед логированием, изоляция клиентов в памяти и при поиске
- Валидация вывода и средства защиты контента (Output validation and content guardrails)
- Осведомленность о рисках конфиденциальности данных при использовании внешних API LLM
1.6. Данные / Поиск
Обязательно:
- Понимание конвейеров поиска (retrieval pipelines):
- Эмбеддинги (Embeddings)
- Чанкинг (Chunking)
- Переранжирование (Reranking)
- Настройка качества поиска (Retrieval quality tuning)
- Опыт работы с векторными хранилищами / векторными БД любого типа
- Работа со структурированными и неструктурированными данными
1.7. Инженерная основа
Обязательно:
Str