Свяжитесь напрямую по этой вакансии
Старший LLM-разработчик в Нейро
Мы развиваем Нейро — систему моделей для построения ответов LLM с использованием поиска как источника информации и обогащений ответа. Мы внедрили такую систему в Поиск Яндекса и сейчас стоим перед новым вызовом: научиться решать сложные сценарии с использованием Поиска, которые возникают в чате с Алисой.
Представьте запрос «составь план путешествия, чтобы увидеть косаток летом». Чтобы построить хороший ответ на него, нужны многостадийный поиск, использование картинок и данных от отелей, хорошая структура и высокая достоверность. И таких запросов — сотни тысяч из разных аспектов.
Наша команда отвечает за Align-модели Нейро: обучает SFT, исследует самые новые алгоритмы RL, максимизирует реворды, внедряет длинные контексты и MoE. Также важна часть с оптимизациями моделей: Нейро используют десятки миллионов человек, и чтобы держать такую нагрузку, нужно постоянно искать и внедрять новые методы оптимизации. Сейчас перед нами стоят новые вызовы, и мы ищем в команду сильного DL-разработчика, знающего LLM и умеющего писать код.
Исследование подходов RL Так как Нейро должен не только писать тексты, но и использовать картинки, видео, подходящую структуру, мы используем десятки реворд-моделей для оптимизации разных аспектов. Сейчас наши основные методы — DPO и CE-RL, но они несовершенны, и мы хотим обучаться эффективнее. Нужно будет читать статьи, реализовывать новые методы, а также совершенствовать текущие.
Оптимизации моделей Раскатка Нейро на миллионы пользователей — это очень дорого, а когда речь начинает идти о многостадийных поисках, то числа становятся совсем заоблачными. Нужно исследовать, реализовывать и иногда дебажить квантования, дистилляции, спекдеки. А потом внедрять их без потерь качества.
Поиск новых направлений Когда делаешь новый продукт, возникает множество челленджей, и важно среди них находить точки роста, которые потом конвертируются в задачи. Например, нам не хватает более длинного контекста, не хватает умения «видеть» картинки. Когда такая точка роста находится, нужно превратить её в задачу, договориться со смежниками про совместные действия и довести эту задачу до конца в вопросах не только разработки, но и менеджмента. Такие задачи отлично помогают расти в сторону лида или техлида, и возникают они регулярно.
Больше об ML в Яндексе — в канале Yandex for ML
3 лет
Опыт работы
Полная занятость
Тип занятости
Senior
Грейд
Data Science & ML
Специализация
AI
Отрасль
Корпорация
Тип компании
AI
Отрасль
Корпорация
Тип компании