Свяжитесь напрямую по этой вакансии
Инженер по внедрению Алисы в Поиск (С++)
Алиса в Поиске — ключевой продукт Яндекса: генеративные ответы вверху выдачи ежедневно видят десятки миллионов пользователей. Под капотом не одна LLM, а семейство моделей с разными размерами и свойствами.
Мы ищем опытного разработчика, который будет работать на пересечении продуктовой разработки, ML-команд и инфраструктуры. Основная задача — сборка и поддержка полноценных конфигураций моделей для релизов: от формирования требований до интеграции сервисов в прод с учётом инфраструктурных ограничений и продуктовых сценариев.
Отдельные команды создают части будущего продукта:
Но без связующего слоя, который соединяет их в единый рабочий продукт, невозможно выкатывать модели в прод стабильно и предсказуемо, контролировать влияние изменений на метрики и потребление ресурсов, быстро реагировать на изменение продуктовых требований.
Вашей задачей будет собрать работающую и масштабируемую конфигурацию: подобрать модели под продуктовый сценарий, адаптировать рантайм-пайплайны для вычислений, учесть ограничения инфраструктуры, довести конфигурацию до прод-состояния. Вы будете понимать устройство экспериментальных ML-пайплайнов, модифицировать их под прод-сценарии, поднимать сервисы и решать вопросы интеграции между командами.
Эта роль обеспечивает системность и техническую достоверность доставки ML-результатов до пользователя. Ваши решения определят скорость релизов и качество итогового продукта.
Работа с пайплайнами ответов Вам предстоит модифицировать и поддерживать вычислительные пайплайны (C++, Jinja), поднимать генеративные, DSSM- и BERT-модели в существующей инфраструктуре и интегрировать их в вычислительные пайплайны, а также помогать в диагностике проблем по результатам экспериментов со стороны разработки.
Работа с офлайн-базой генеративных ответов Вы будете заниматься поддержкой функциональности для сбора, обновления и переобхода данных, проводить продуктовые доработки поверх существующего хранилища.
Проведение A/B-экспериментов Нужно будет формировать корректные выборки и срезы для A/B-экспериментов с учётом наработок команд фронтенда, среза, базового качества моделей, инфраструктуры генеративных сервисов и других. Вы будете поддерживать сопутствующие негенеративные сервисы: C++, работу с базой, Python для автоматизации поднятия сервисов.
3-5 лет
Опыт работы
Полная занятость
Тип занятости
Гибрид, Офис
Формат работы
Middle
Грейд
Разработка ИИ
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
По городу
Разработка ИИ
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании