ML-инженер в группу онлайн-обучения генеративной персонализации

Мы создаём рекомендательные системы, которые помогают миллионам пользователей находить именно то, что им нужно. Наша команда работает на стыке рекомендательных систем, глубокого обучения и инфраструктуры, надёжно внедряя передовые нейросетевые подходы в высоконагруженные сервисы с тысячами RPS.

Что у нас есть: * Высокая техническая и исследовательская культура * Удобные инструменты для прототипирования и проведения экспериментов * Сотни топовых GPU и петабайты логов для обучения и инференса моделей * Вариативность проектов и развитие экспертного опыта в области рекомендаций на различных доменах внутри команды * Возможность внедрять E2E-решения, которые непосредственно влияют на пользователей

Мы также делимся результатами наших исследований и выступаем на конференциях (RecSys, KDD).

Наши статьи: * Scaling Recommender Transformers to One Billion Parameters * Correcting the LogQ Correction: Revisiting Sampled Softmax for Large-Scale Retrieval * Yambda-5B: A Large-Scale Multi-modal Dataset for Ranking And Retrieval

Какие задачи вас ждут

Ускорять алгоритмы RL-дообучения рекомендательных моделей Мы умеем улучшать качество рекомендаций, используя Reinforcement Learning (GRPO, DPO) для быстрой адаптации моделей на основе свежего пользовательского фидбэка. Вам предстоит создавать и оптимизировать рантайм-пайплайн, который позволит дообучать и выкатывать обновлённые нейросетевые модели за десятки минут. Ключевой фокус — на ускорении итераций RL-цикла и эффективном использовании вычислительных ресурсов.

Строить и внедрять распределённый RT-процессинг Для обучения и сервинга современных рекомендательных моделей, работающих с объёмным пользовательским профилем, необходима надёжная и эффективная поставка семплов. Вы будете расширять существующие и создавать новые системы для сервисов Яндекса, которые обеспечивают хранение, передачу и обработку таких данных с гарантией высокой доступности и бесперебойной работы RL-пайплайнов.

Внедрять концепцию Feature Store для улучшения ML-пайплайнов Как обеспечить идентичную обработку признаков для нейросетевых моделей в режимах real-time-инференса и дообучения? Мы разрабатываем фреймворк, который уже внедрён в домены Музыки и Картинок и гарантирует такую консистентность. Вам предстоит расширять его функциональность и сферу применения, уделяя внимание специфике работы с данными для обучения с подкреплением.

Мы ждём, что вы

Владеете Python и C++, в том числе имеете уверенные навыки оптимизации
Понимаете принципы распределённой обработки данных и парадигмы MapReduce
Знаете основы работы нейронных сетей
Умеете разбираться в чужом коде и предлагать улучшения архитектуры

Будет плюсом

Занимались разработкой и отладкой многопоточных или высоконагруженных систем

Контакты

Какие задачи вас ждут

Мы ждём, что вы

Будет плюсом

Похожие вакансии

ML-исследователь генеративных моделей персонализации

ML-разработчик-исследователь для R&D рекомендательных систем

ML-инженер в Карты

ML-разработчик в команду рекомендательных систем

ML-разработчик в команду ленты Ритма

ML-разработчик-исследователь в команду Alignment службы синтеза речи

ML-разработчик в группу обучения с подкреплением (RL)

Ведущий ML-разработчик в команду контент-системы товарного поиска

ML-инженер в команду распространения рекомендательных технологий

ML-разработчик в команду поисковых подсказок

ML-разработчик в команду Блендера Поиска

Старший DL-разработчик в команду Нейро

ML-инженер в группу онлайн-обучения генеративной персонализации

Ключевые навыки

Детали

Средняя заработная плата на позиции