MLE/MLOps — Teletype
TLDR: Мы ищем специалиста MLE/MLOps, который будет полностью отвечать за наш инфраструктуру инференса — от оптимизации сервисных движков до построения векторных поисковых пайплайнов — соединяя работу исследователей и продуктовой команды для выпуска моделей, которые быстры, экономичны и готовы к эксплуатации.
О нас
White Circle — компания в области безопасности ИИ, создающая уровень безопасности, надежности и оптимизации для ИИ-систем. В основе нашей платформы лежат политики — простые правила на естественном языке, определяющие, что ИИ-модель должна и не должна делать. Мы автоматически тестируем, обеспечиваем соблюдение и непрерывно улучшаем эти политики в масштабе.
- Мы привлекли $11 млн от ведущих фондов, основателей и руководителей из OpenAI, Anthropic, HuggingFace, Mistral, DeepMind, Datadog, Sentry и других
- Мы обрабатываем более ста миллионов API-вызовов каждый месяц
- Мы настраиваем и обучаем собственные LLM, чтобы они работали быстрее и дешевле любой открытой или проприетарной модели
Что вы будете делать
- Полная ответственность за инфраструктуру инференса: оптимизация времени выполнения, пропускной способности и затрат по всей нашей модельной группе.
- Разработка и масштабирование сервиса моделей с использованием TensorZero, vLLM/SGlang/TRT и Kubernetes.
- Проектирование и поддержка векторных поисковых пайплайнов с использованием Vector storages.
- Знание метрик поддержки (SLAs, FCR, deflection) и способность определять ключевые показатели здоровья сервиса.
- Превращение исследований в продукт: взятие экспериментальных моделей от исследовательской команды, определение готовности к производству и их выпуск — форматирование, параметры семплирования, deployment, всё полностью.
Кто вы
- 3+ года работы над высокопроизводительными ML-системами, запущенными в эксплуатации, не только тренировочными ноутбуками
- Глубокий практический опыт в оптимизации инференса — вы отлавливали скачки времени выполнения и знаете разницу между теоретической и реальной пропускной способностью
- Свободное владение всем стеком: от CUDA kernel до Kubernetes manifests до Grafana dashboards
Большой плюс: опыт работы с Rust, custom Triton kernels, benchmarks
Почему White Circle
- Зарплата от $100,000 до $150,000 + доли в компании
- 20 дней оплачиваемого отпуска
- Работа в Париже (гибридный режим) + помощь с релокацией
- Лучшая медицинская страховка в Франции
- Все необходимые оборудование, инструменты и услуги
- Покрытие подписок на ИИ-агенты и IDE
- Командные оффсайты дважды в год: мы были в Альпах и в Сен-Тропе
Как мы нанимаем
- Вводный звонок с одним из наших коллег
- Выполнение домашнего задания
- Показать себя в техническом интервью
- Финальный звонок с CEO и CTO