Старший LLM-разработчик в Нейро

Мы развиваем Нейро — систему моделей для построения ответов LLM с использованием поиска как источника информации и обогащений ответа. Мы внедрили такую систему в Поиск Яндекса и сейчас стоим перед новым вызовом: научиться решать сложные сценарии с использованием Поиска, которые возникают в чате с Алисой.

Представьте запрос «составь план путешествия, чтобы увидеть косаток летом». Чтобы построить хороший ответ на него, нужны многостадийный поиск, использование картинок и данных от отелей, хорошая структура и высокая достоверность. И таких запросов — сотни тысяч из разных аспектов.

Наша команда отвечает за Align-модели Нейро: обучает SFT, исследует самые новые алгоритмы RL, максимизирует реворды, внедряет длинные контексты и MoE. Также важна часть с оптимизациями моделей: Нейро используют десятки миллионов человек, и чтобы держать такую нагрузку, нужно постоянно искать и внедрять новые методы оптимизации. Сейчас перед нами стоят новые вызовы, и мы ищем в команду сильного DL-разработчика, знающего LLM и умеющего писать код.

Какие задачи вас ждут

Исследование подходов RL Так как Нейро должен не только писать тексты, но и использовать картинки, видео, подходящую структуру, мы используем десятки реворд-моделей для оптимизации разных аспектов. Сейчас наши основные методы — DPO и CE-RL, но они несовершенны, и мы хотим обучаться эффективнее. Нужно будет читать статьи, реализовывать новые методы, а также совершенствовать текущие.

Оптимизации моделей Раскатка Нейро на миллионы пользователей — это очень дорого, а когда речь начинает идти о многостадийных поисках, то числа становятся совсем заоблачными. Нужно исследовать, реализовывать и иногда дебажить квантования, дистилляции, спекдеки. А потом внедрять их без потерь качества.

Поиск новых направлений Когда делаешь новый продукт, возникает множество челленджей, и важно среди них находить точки роста, которые потом конвертируются в задачи. Например, нам не хватает более длинного контекста, не хватает умения «видеть» картинки. Когда такая точка роста находится, нужно превратить её в задачу, договориться со смежниками про совместные действия и довести эту задачу до конца в вопросах не только разработки, но и менеджмента. Такие задачи отлично помогают расти в сторону лида или техлида, и возникают они регулярно.

Подробнее про Alice AI

Больше об ML в Яндексе — в канале Yandex for ML

Мы ждём, что вы

Понимаете, как устроены LLM, как они обучаются и какие у них степени свободы
Знаете классические DL и ML
Пишете код на Python
Читаете статьи, готовы к сложным вызовам и амбициозным задачам

Будет плюсом

Работали с RL
Реализовывали методы оптимизации или продакшн-инференса моделей

Контакты

Какие задачи вас ждут

Мы ждём, что вы

Будет плюсом

Похожие вакансии

Старший LLM-разработчик в команду Нейро

Старший DL-разработчик в команду Нейро

Руководитель группы DL-разработки международного направления Нейро (LLM)

Старший ML-разработчик (NLP/LLM) в команду продукта Нейросейлз

DL-разработчик в группу качества Нейро

Старший LLM-разработчик в команду алайнмента YandexGPT

Senior LLM Researcher (Центр практического искусственного интеллекта)

ML engineer LLM GigaChat

ML-engineer (GigaChat Data)

NLP-разработчик в команду претрейна YandexGPT

Руководитель группы рассуждений YandexGPT

Старший ML-разработчик в команду качества претрейна YandexGPT

Старший LLM-разработчик в Нейро

Ключевые навыки

Детали