Senior Machine Learning Engineer
Присоединяйтесь к Runware в качестве Senior Machine Learning Engineer и будьте в авангарде разработки инновационных AI-решений для различных медиа-модальностей, включая текст, изображения, видео, 3D и аудио. Мы создаем мощную платформу для создания медиа на базе ИИ, призванную революционизировать способы генерации контента.
В качестве Senior Machine Learning Engineer вы будете руководить критически важными проектами, управляя полным жизненным циклом: от исследований и экспериментов до развертывания в производственной среде и мониторинга производительности. Ваша работа поможет формировать возможности нашей платформы и улучшить опыт пользователей, которые полагаются на наши передовые AI-технологии.
Что вы будете делать
- Интегрировать открытые и сторонние модели в нашу платформу инференса
- Руководить инициативами по тонкой настройке (LoRA, адаптеры, PEFT, адаптация к домену)
- Оптимизировать рабочие нагрузки инференса с точки зрения задержки, пакетной обработки, эффективности использования памяти и пропускной способности
- Сравнивать качество моделей с затратами и производительностью по различным модальностям
- Улучшать время запуска инференса и стабильность под высокой нагрузкой
- Создавать фреймворки оценки и внутренние инструменты для валидации моделей
- Тесно сотрудничать с командами Infrastructure и Backend по созданию масштабируемых систем обслуживания
- Отслеживать производительность в производственной среде и проводить постоянную оптимизацию
- Менторить инженеров и помогать повышать уровень ML-инжиниринга в команде
Что мы ищем
- Подтвержденный опыт внедрения ML-систем в производственные среды
- Глубокие навыки работы с Python на низком уровне и большой практический опыт работы с PyTorch
- Опыт работы с диффузионными моделями, LLM или мультимодальными архитектурами
- Практический опыт тонкой настройки больших моделей (LoRA, PEFT, адаптеры и т. д.)
- Опыт оптимизации рабочих нагрузок инференса в GPU-средах
- Глубокое понимание оценки моделей, экспериментирования и мониторинга
- Способность отлаживать проблемы производительности, памяти и надежности в производственной среде
- Хорошее понимание системного мышления, как ML-решения влияют на инфраструктуру
- Высокий уровень ответственности и комфорт работы в быстро меняющейся стартап-среде
Желательно
- Опыт работы с vLLM или пользовательскими серверами инференса
- Опыт работы с Kubernetes или контейнеризированными ML-рабочими нагрузками
- Опыт работы с высокопроизводительными распределенными системами
- Опыт в области генерации медиа с помощью ИИ (изображения, видео, аудио)
- Опыт создания внутренних ML-инструментов или API для разработчиков
- Опыт работы с ядрами в CUDA/C++
Мы — команда, работающая преимущественно удаленно, но дважды в год мы собираемся вместе лично для планирования, сотрудничества и празднования успехов. В течение дня у нас есть несколько основных часов для командной работы, но помимо этого вы сами устанавливаете график, который помогает вам выполнять свою лучшую работу.
Наша среда динамична и амбициозна. Большие усилия — неотъемлемая часть создания продуктов, определяющих категорию, но мы уравновешиваем это гибким графиком работы, щедрым отпуском и регулярными ретритами, чтобы команда оставалась сосредоточенной и мотивированной.
- Щедрый оплачиваемый отпуск — отпуск, больничные, государственные праздники
- Значимые опционы на акции — разделяйте прибыль от созданной вами ценности
- Удаленный формат работы — работайте из дома в любой стране, где мы можем вас трудоустроить
- Гибкий график — управляйте своим расписанием вне основных блоков совместной работы
- Семейный отпуск — оплачиваемый отпуск по беременности, для отцов и уходу за близкими
- Ретриты компании — дважды в год встречи в вдохновляющих местах