Свяжитесь напрямую по этой вакансии
Старший DL-разработчик в команду Нейро
Нейро — это мультимодальный продукт будущего, где мощь генеративных моделей сочетается с различными источниками внешней информации, список которых постоянно расширяется: веб-поиск, поиск по картинкам, информация об организациях на Картах и т. д. Мы внедрили такую систему в Поиск Яндекса и сейчас стоим перед новым вызовом: научиться решать сложные сценарии, которые возникают в чате с Алисой.
Мы разрабатываем LLM-оценщик и реворд-модели — это ключевые элементы пайплайна Нейро: их оценки напрямую влияют на то, как нейросети Яндекса учатся, генерируют и анализируют. Наш LLM-асессор не только обнаруживает ошибки, но и объясняет их, приближая нас к созданию системы, которая умеет думать, анализировать и совершенствоваться. Именно мы направляем Нейро в сторону генеративного продукта будущего.
Присоединяйтесь к нам, чтобы конкурировать с международными IT-гигантами и делать продукт будущего в настоящем!
Улучшение Нейро в Алисе Вам предстоит совершенствовать процесс алайнмента Нейро с использованием реворд-моделей и LLM-оценщика, а также решать смежные задачи, которые связаны с алайнментом.
Исследования в области LLM-as-a-judge Вы будете проводить эксперименты с подходами test-time scaling для LLM-оценщика, который не только ставит оценки, но и объясняет их.
Улучшение LLM-оценщика Нужно улучшать LLM-оценщика на всех стадиях его обучения: от annealing до GRPO, а также развивать мультимодальный VLM-оценщик: мы стремимся научить LLM-асессор оценивать не только текст, но и другое мультимодальное обогащение ответа.
Больше об ML в Яндексе — в канале Yandex for ML
3 лет
Опыт работы
Полная занятость
Тип занятости
Senior
Грейд
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
3 лет
Опыт работы
Полная занятость
Тип занятости
Senior
Грейд
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании