Старший ML-разработчик в команду качества претрейна YandexGPT

Наша команда отвечает за претрейны YandexGPT — первый и самый ресурсоёмкий этап обучения LLM. Мы занимаемся подбором данных, постановкой экспериментов, выбором процедуры обучения и самим обучением больших LLM-моделей. Наша цель — делать так, чтобы эти модели оставались лучшими для российских пользователей, а в перспективе — выиграть гонку AI.

LLM-модели YandexGPT служат основой для ряда сервисов в Яндексе — например, Алисы и Нейро в Поиске — и используются во многих других, например в Браузере, Маркете, Рекламе и Переводчике. Качество работы этих продуктов напрямую зависит от базовых моделей, которые мы предоставляем. Кроме того, наши модели доступны для пользователей по API через Yandex Cloud.

Какие задачи вас ждут

Улучшение навыков LLM-модель — это универсальный инструмент, его можно применять для самых разных задач. Один из способов улучшить нашу модель — выбрать конкретное направление или навык нейросети и сосредоточиться на нём. Например, навыки это: работа с кодом, решение математических задач, извлечение информации из текста, логика, умение переформулировать текст, знание фактов.

Вам предстоит найти способ улучшить выбранный навык: это может быть как работа с данными, например сбор подходящего датасета или генерация синтетических данных, так и изменения в процессе обучения модели.

Исследование процесса обучения Качество итоговой модели зависит во многом и от того, какая схема обучения и гиперпараметры были выбраны. Это бывает непросто, особенно для больших моделей, когда попыток может быть одна или две. Вам предстоит исследовать методы, помогающие сделать такой выбор правильно, на основе Scaling Laws, экспериментов с моделями меньшего размера и другой имеющейся информации.

Кроме того, мы сейчас вкладываемся в механистическую интерпретируемость — то есть методы, с помощью которых можно анализировать, почему LLM-модель выдаёт тот или иной ответ, и какие данные в обучении на это повлияли.

Мультимодальность В Яндексе ведутся разработки не только текстовых LLM, но и моделей, которые работают с аудио, картинками и видео. Нам предстоит большая работа по объединению этих результатов в мультимодальный претрейн: нужно будет собрать датасет и подобрать схему обучения так, чтобы у общего претрейна качество было таким же или превосходящим специализированные модели.

Поиск новых направлений Обучение LLM — это быстро развивающаяся область, тут постоянно выходят новые исследования и релизы от конкурентов. Важно выделять из этого потока те результаты, которые с высокой вероятностью помогут нам в достижении наших целей. Вам предстоит регулярно находить такие исследования, рассказывать о них коллегам и реализовывать у нас. Также понятно, что для технологического лидерства недостаточно воспроизводить существующие результаты. От вас, как от старшего исследователя, ожидаем предложений новых идей и подходов к сбору данных и обучению LLM.

Подробнее про Alice AI

Больше об ML в Яндексе — в канале Yandex for ML

Мы ждём, что вы

Разбираетесь в том, как устроены LLM, и имеете опыт работы в NLP или других областях DL
Умеете находить в потоке выходящих статей и исследований те, которые стоит попробовать
Можете генерировать новые идеи, которые приводят к улучшению результата
Готовы к высокому темпу работы, необходимому для конкуренции с ведущими игроками в мире AI

Контакты

Какие задачи вас ждут

Мы ждём, что вы

Похожие вакансии

NLP-разработчик в команду претрейна YandexGPT

Техлид / старший ML-разработчик в команду Железного стажёра

Старший ML-разработчик (NLP/LLM) в команду продукта Нейросейлз

ML-разработчик в команду генеративных еком-сценариев (LLM)

Руководитель группы рассуждений YandexGPT

NLP-разработчик в Техплатформу

DL-разработчик в команду исследования архитектуры YandexGPT

Старший LLM-разработчик в команду алайнмента YandexGPT

ML-разработчик в группу качества машинного обучения контент-системы e-сom

ML-разработчик в группу срабатываний генеративных ответов

Старший DL-разработчик в команду Нейро

NLP-разработчик в Браузер

Старший ML-разработчик в команду качества претрейна YandexGPT

Ключевые навыки

Детали

Средняя заработная плата на позиции