Старший DL-разработчик в команду Нейро

Нейро — это мультимодальный продукт будущего, где мощь генеративных моделей сочетается с различными источниками внешней информации, список которых постоянно расширяется: веб-поиск, поиск по картинкам, информация об организациях на Картах и т. д. Мы внедрили такую систему в Поиск Яндекса и сейчас стоим перед новым вызовом: научиться решать сложные сценарии, которые возникают в чате с Алисой.

Мы разрабатываем LLM-оценщик и реворд-модели — это ключевые элементы пайплайна Нейро: их оценки напрямую влияют на то, как нейросети Яндекса учатся, генерируют и анализируют. Наш LLM-асессор не только обнаруживает ошибки, но и объясняет их, приближая нас к созданию системы, которая умеет думать, анализировать и совершенствоваться. Именно мы направляем Нейро в сторону генеративного продукта будущего.

Присоединяйтесь к нам, чтобы конкурировать с международными IT-гигантами и делать продукт будущего в настоящем!

Какие задачи вас ждут

Улучшение Нейро в Алисе Вам предстоит совершенствовать процесс алайнмента Нейро с использованием реворд-моделей и LLM-оценщика, а также решать смежные задачи, которые связаны с алайнментом.

Исследования в области LLM-as-a-judge Вы будете проводить эксперименты с подходами test-time scaling для LLM-оценщика, который не только ставит оценки, но и объясняет их.

Улучшение LLM-оценщика Нужно улучшать LLM-оценщика на всех стадиях его обучения: от annealing до GRPO, а также развивать мультимодальный VLM-оценщик: мы стремимся научить LLM-асессор оценивать не только текст, но и другое мультимодальное обогащение ответа.

Подробнее про Alice AI

Больше об ML в Яндексе — в канале Yandex for ML

Мы ждём, что вы

Видите за PyTorch-кодом математику: понимаете, как устроены LLM «под капотом»
Умеете превращать научные статьи в код: реализовывали SOTA-методы и алгоритмы
Обладаете широким кругозором и компетенциями в NLP и DL

Будет плюсом

Обладаете глубокими знаниями в области LLМ и RL
Работали с крупными моделями и распределённым обучением

Контакты

Какие задачи вас ждут

Мы ждём, что вы

Будет плюсом

Похожие вакансии

Старший LLM-разработчик в команду Нейро

Старший LLM-разработчик в Нейро

Руководитель группы DL-разработки международного направления Нейро (LLM)

DL-разработчик в группу качества Нейро

ML-разработчик в команду VLM Foundations

DL-разработчик в команду исследования архитектуры YandexGPT

Старший DL-разработчик в команду разработки агентов и функций YandexGPT

Старший ML-разработчик (NLP/LLM) в команду продукта Нейросейлз

ML-разработчик в группу обучения с подкреплением (RL)

Senior LLM Researcher (Центр практического искусственного интеллекта)

ML-исследователь в команду архитектур с ранним связыванием

Руководитель группы рассуждений YandexGPT

Старший DL-разработчик в команду Нейро

Ключевые навыки

Детали

Детали