Свяжитесь напрямую по этой вакансии
Разработчик инфраструктуры LLM
Инференс LLM в масштабе — это сложная инфраструктурная задача: GPU работают на пределе, возникают сетевые задержки, возможны сбои оборудования. Мы создаём решения, чтобы эти события минимально влияли на доступность и latency нашего сервиса инференса.
Оптимизация инференсных движков Вам предстоит повышать эффективность и снижать latency при выполнении LLM-инференса на GPU.
Развитие инструментов диагностики Вы будете создавать и улучшать инструменты для быстрого выявления и устранения инфраструктурных проблем, которые влияют на стабильность и скорость инференса.
Исследование и внедрение Вам предстоит работать с методами оптимизации инференса (квантованием, прунингом) и современными подходами к параллелизации.
3 лет
Опыт работы
Полная занятость
Тип занятости
Разработка ИИ
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
3 лет
Опыт работы
Полная занятость
Тип занятости
Разработка ИИ
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании