Что вы будете делать:
- Запуск продакшн-систем с агентами — Проектирование и создание агентов и рабочих процессов агентов, которые решают определенную задачу от начала до конца. Вы отвечаете за промпты, инструменты, поиск, средства контроля, наблюдаемость, бюджеты затрат и задержек, а также за развертывание.
- Автоматизация рабочих процессов SME — Выявление высокоэффективных операционных задач (конвейеры проверки, контроль качества контента, циклы маркировки и операций, сортировка запросов поддержки, внутренние помощники) и сотрудничество с SME, управляющими этими рабочими процессами, для определения критериев успеха, проверки результатов и замены значительных частей этой работы системами ИИ, которым они доверяют. SME являются совладельцами качества с самого начала проекта.
- Управление циклом оценки и эталонными наборами данных, которые его формируют — Создание офлайн-оценок, LLM-как-судья с калибровкой, регрессионных наборов и онлайн-метрик. Поддержание версионированных, очищенных эталонных наборов данных, охватывающих намерения, сложность, крайние случаи и враждебные входные данные, а также их непрерывное обогащение реальными производственными сбоями и проверенными SME метками. План измерения определяет, будет ли функция выпущена.
- Обеспечение безопасности функций ИИ — Относитесь к тому, что вы поставляете, как к регулируемому продукту. Проектируйте с учетом соответствующих нормативных рамок (например, COPPA, FERPA) с самого начала, проводите оценки безопасности и предвзятости до запуска и постоянно после него, а также создавайте элементы управления «человек в контуре» и фильтрации контента, которые необходимы функциям ИИ, прежде чем они достигнут конечных пользователей.
- Передача того, что вы выпускаете — Продакшн-функции покидают ваши руки с документацией, руководствами по эксплуатации, средством оценки и панелями мониторинга. Встраивание не считается завершенным, пока принимающая команда не внесет изменения в систему без вашего участия. Типичная продолжительность встраивания составляет от 4 до 12 недель.
- Упрощение создания функций ИИ для остальной части инженерной команды — Внутренние библиотеки, шаблоны и руководства, чтобы другие команды могли выпускать функции ИИ без вашего прямого участия.
Что вам нужно:
- 7+ лет профессионального опыта работы инженером, из которых не менее 1 года практического опыта создания систем с агентами на базе как минимум одного современного стека (LangGraph, Anthropic SDK / Claude Agent SDK, OpenAI Agents SDK, Pydantic-AI, Mastra, LlamaIndex, CrewAI или самописный стек). Нас интересует, что вы создали и эксплуатировали системы с агентами в продакшене, а не какой фреймворк.
- Хорошее знание Python плюс один типизированный язык для продакшн-сервисов (TypeScript, Go или аналогичный). Опыт работы в облаке (AWS или GCP) и контейнеризированное развертывание.
- Основы инженерии программного обеспечения уровня Senior или Staff с многолетним опытом работы в продакшн-среде и успешным опытом вывода систем на рынок.
- Несколько выпущенных функций на базе LLM в продакшн-среде с конкретными историями о том, что сломалось, как вы это исправили и что бы вы сделали иначе.
- Практическое знание распространенных шаблонов агентов: ReAct, использование инструментов с структурированными схемами, цепочки промптов, маршрутизация, оркестратор-воркеры, оценщик-оптимизатор / рефлексия и «человек в контуре». Вы можете определить, когда детерминированный рабочий процесс является правильным решением, а не автономный агент.
- Практический опыт работы в продакшн-среде с поиском: чанкинг, эмбеддинги, гибридный поиск, переранжирование, фильтрация метаданных и сбойные режимы каждого из них. Рабочее знание методов заземления, которые привязывают сгенерированные ответы к полученным доказательствам (цитирование и извлечение цитат, оценки фактичности и отказа, постфактумные проверки согласованности).
- Сильная практика промпт-инжиниринга: шаблоны zero-shot, few-shot и many-shot; выбор и порядок примеров; обучение в контексте и цепочка рассуждений.
- Уверенное владение структурированным выводом и валидацией в продакшене (собственные структурированные выводы провайдера, Instructor, Pydantic-AI, Outlines или сопоставимый подход).
- Дисциплинированная практика оценки. Вы не полагаетесь на субъективное рассмотрение при принятии решения о готовности системы.
- Отличные письменные и устные коммуникативные навыки. Вы можете объяснить архитектурный компромисс как руководителю, так и младшему инженеру на одной неделе.
- Вы комфортно пользуетесь инструментами для написания кода с ИИ в своем рабочем процессе реализации, при этом вы отвечаете за постановку задачи, выбор дизайна и проверку. Мы измеряем ваш результат по работающим системам, а не по количеству написанных строк кода.
Желательно:
- Расширенный опыт поиска: GraphRAG, поиск с агентами, настройка поиска на основе оценок и гибридный поиск в масштабе.
- Прямой или передаваемый опыт работы с ограничениями безопасности, конфиденциальности и политики в пользовательском ИИ. Опыт работы в K-12 или других регулируемых областях является большим плюсом.
- Опыт работы с фреймворками оптимизации промптов (DSPy, TEXTGRAD, AdalFlow), где они оказались полезными в продакшене.
- Публичный репозиторий, пакет, gist или техническая статья о значимой работе в области ИИ, или репрезентативный проект, который вы можете подробно описать в рамках ваших ограничений конфиденциальности.
- Вклад в open-source инструменты для ИИ (фреймворки, агенты, средства оценки, MCP-серверы).
Примечание о нашем процессе собеседования
Один из наших раундов собеседования — это сессия кодирования с помощью ИИ. Принесите свою собственную установку и решите реальную проблему в прямом эфире с помощью ИИ. Мы смотрим, как вы взаимодействуете с инструментами ИИ: как вы составляете промпты, проверяете результаты, отлавливаете плохие предложения, решаете, когда нужно переопределить, и создаете код, соответствующий производственным стандартам. Это не раунд алгоритмов в стерильной среде.