Research Engineer (Agentic Models)
Амстердам, Нидерланды; Белград, Сербия; Берлин, Германия; Лимассол, Кипр; Лондон, Великобритания; Мадрид, Испания; Мюнхен, Германия; Пафос, Кипр; Прага, Чехия; Удаленно, Германия; Варшава, Польша; Ереван, Армения
В JetBrains мы обожаем код. С момента основания в 2000 году мы стремимся создавать самые сильные и эффективные инструменты для разработчиков в мире. Сегодня помощь и агенты на основе ИИ становятся ключевой частью работы разработчиков в наших IDE.
Мы создаем многошаговых кодовых агентов, которые могут понимать большие кодовые базы, планировать изменения, вызывать инструменты и итерировать с пользователем. В качестве инженера-исследователя в команде Agentic Models вы будете отвечать за модели, циклы обучения и конвейеры оценки, которые питают этих агентов.
Вы будете работать на стыке SFT и пост-тренировки в стиле RL, а также продуктовой оценки, используя наши распределенные GPU и кластеры MapReduce для внедрения моделей в продукты JetBrains.
В составе нашей команды вы будете:
- Разрабатывать, внедрять и поддерживать конвейеры SFT и RL пост-тренировки для многошаговых кодовых агентов.
- Обучать и адаптировать LLM для рабочих процессов агентов, включая планирование, использование инструментов и многошаговые взаимодействия внутри IDE JetBrains.
- Создавать и развивать среды оценки и симуляции, где кодовые агенты могут действовать, измеряться и сравниваться на реалистичных задачах разработчиков.
- Разрабатывать фреймворки оценки и метрики для поведения агентов, анализировать трассировки и логи, а также замыкать цикл от оценки обратно к обучению, данным и проектированию вознаграждений.
- Анализировать результаты обучения и оценки для предложения и внедрения улучшений в архитектуры моделей, рецепты обучения и наборы данных.
- Работать с крупномасштабной инфраструктурой, включая распределенное обучение на GPU-кластерах и обработку больших данных в стиле MapReduce для наборов данных предварительного обучения и тонкой настройки.
- Тесно сотрудничать с исследовательскими, продуктовыми и инфраструктурными командами для преобразования высокоуровневых продуктовых идей в конкретные модели, эксперименты и выпущенные функции.
Мы будем рады принять вас на борт, если у вас есть:
- Обширный практический опыт обучения LLM (предварительное обучение, тонкая настройка или пост-тренировка) в исследовательских или производственных условиях.
- Глубокая экспертиза в современных фреймворках глубокого обучения, таких как PyTorch, и специализированных стеках для обучения LLM (например, Megatron, NeMo, verl или аналогичных).
- Сильное теоретическое и практическое понимание основ LLM: архитектуры, токенизация, конвейеры данных, пакетирование, смешанная точность, распределенное обучение и отладка нестабильных запусков.
- Способность полностью самостоятельно вести проекты, начиная с общей проблемы или болевой точки продукта и проходя через этапы проектирования, экспериментирования, внедрения и итерации.
- Продуктовое мышление – вы заботитесь о том, как разработчики фактически используют агентов, и можете преобразовывать потребности продукта и режимы сбоев в работу с моделями и оценкой.
- Опыт работы с Python не менее 3 лет, написание чистого, поддерживаемого кода в современных кодовых базах ML.
Наш идеальный кандидат будет иметь опыт работы с:
- Оркестраторами ML и инструментами рабочего процесса, такими как Kubeflow, Dagster, Airflow, ZenML, и/или планировщиками заданий, такими как Kubernetes или SLURM.
- Крупномасштабными конвейерами данных и обучения, например, кластерами в стиле MapReduce, многоузловым GPU-обучением или рабочими нагрузками порядка 1 млн+ часов CPU/GPU.
- Разработкой и поддержкой конвейеров оценки для LLM или агентов, включая метрики, панели мониторинга, отслеживание экспериментов и автоматизированные проверки регрессий.
- Разработкой AI-агентов, таких как агенты, использующие инструменты, планировщики или многошаговые рабочие процессы кодирования, а также знакомство с фреймворками или паттернами агентов.
- Отслеживанием экспериментов и наблюдаемостью с использованием таких инструментов, как Weights & Biases, MLflow, Langfuse или аналогичных.
- Оптимизацией инференса и обслуживанием оптимизированных моделей в продакшене.
#LI-KP1
Мы являемся работодателем, предоставляющим равные возможности
Мы знаем, что отличные идеи могут прийти от кого угодно и откуда угодно. Именно поэтому мы делаем все возможное, чтобы создать открытую и инклюзивную рабочую среду – такую, которая приветствует всех, независимо от их происхождения, личности, религии, возраста, потребностей в доступности или ориентации.