О роли
Эта роль находится на стыке прикладных исследований и инженерии, включая создание ключевых возможностей ИИ и обеспечение их надежной реализации. Вы будете напрямую влиять на формирование моделей, используемых в наших продуктах, а также на пользовательский опыт и бизнес-ценность, которые они создают.
Чем вы будете заниматься
- Дообучение, дистилляция и обучение с подкреплением
- Создание учебных сред, которые повышают качество синтетических данных и обеспечивают высококачественные сигналы вознаграждения как для обучения с внешней, так и с внутренней политикой.
- Проектирование поведения моделей, оптимизированных для интерпретируемости и превосходного пользовательского опыта.
- Обучение агентных моделей, которые автономно взаимодействуют со сложными структурированными и неструктурированными средами, пишут и прототипируют код, а также работают с мультимодальными входными данными.
- Использование наилучших инструментов для задачи — SFT на синтетических данных, дистилляция на основе внутренней политики, RL или любая их комбинация для снижения затрат на специализированный интеллект.
- Владение конвейерами бенчмаркинга — сбор высококачественных наборов данных и измерение влияния различных параметров или методологий обучения.
- Инженерные принципы
- Инженеры по ИИ — это инженеры: создание кода, готового к промышленной эксплуатации, и владение сквозным процессом работы с данными, обучением, бенчмаркингом и внедрением.
- Архитектура масштабируемых стратегий вывода, максимизирующих эффективность вычислений.
- Поддержка решений для обеспечения стабильной и надежной работы для клиентов.
- Тесное сотрудничество с инженерной командой для проектирования важных точек взаимодействия ИИ и сервисов продукта, таких как интерфейсы, отслеживание вывода, создание контрольных точек, сохранение данных и кэширование.
- Вклад в инженерную культуру: наставничество для коллег, развитие паттернов, повышение планки качества кода, стратегии тестирования и документации.
- Инструменты и ресурсы
- Работа с передовыми моделями с открытыми весами и внутренними фреймворками для обучения.
- Сохранение на переднем крае открытых исследований и инструментов — быстрое прототипирование и валидация новых подходов.
- Вклад во внутренние инструменты для вывода, обучения, оркестрации и генерации данных.
- Гибкие навыки и подход
- Коммуникация идей и объяснение решений — даже для нетехнической аудитории.
- Автономное создание демонстраций и презентация работы всей компании.
- Разбиение неоднозначных проблем на четкую техническую область — мышление за пределами текущих бизнес-потребностей и учет будущей масштабируемости в каждом проекте.
- Проактивное сотрудничество с членами команды и поиск всех ресурсов, необходимых для решения текущей задачи.
Квалификация
Наш идеальный кандидат обладает всем следующим:
- Сильный опыт как в машинном обучении, так и в инженерии
- Отличные коммуникативные навыки и быстрое понимание описаний проблем
- Высокая самостоятельность; готовность предлагать, прототипировать и отвечать за решения
- Опыт дообучения больших моделей (SFT, дистилляция, RL)
- Опыт развертывания моделей в промышленном масштабе
- Предыдущая работа с системами на базе контейнеров (Docker, Kubernetes и т.д.)
- Предыдущий вклад в открытые исследования или инфраструктуру ИИ
- Глубокое знакомство с последними исследованиями в области ИИ и инструментарием с открытым исходным кодом
- Опыт поставки сложного программного обеспечения и владение кодом для промышленной эксплуатации
Будет преимуществом
- Опыт оптимизации производительности архитектуры вывода для максимальной пропускной способности (vLLM, SGlang, llama.cpp)
- Подробные знания фреймворков для RL (верификаторы, ART, prime-rl, trl)
- Публикации моделей, блог-постов или научных работ
Показатели успеха
- Бенчмарки и пользовательские метрики: Качество модели существует не только в лаборатории — как бенчмарки, так и реальные пользовательские метрики критически важны для оценки качества модели.
- Надежность: Минимизация галлюцинаций, максимизация времени бесперебойной работы и согласованности вывода, обеспечение высокой точности ожидаемых выходных данных модели.
- Интерпретируемость: Мы не создаем ИИ как «черный ящик» — все модели должны уметь объяснять процесс рассуждений, разбивать выполнение кода, ссылаться на источники и достигать согласованных решений.
- Влияние: Улучшение внутренних фреймворков и инструментов, развитие технической культуры, обучение команд и обмен знаниями.
- Сотрудничество: Ответственность за проекты без микроуправления, инициатива в поиске и предложении помощи везде, где это возможно.