Свяжитесь напрямую по этой вакансии
Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних клиентов, потом для всей России.
Направления
Улучшение SFT / DPO: тестирование новый подходов к обучению, ускорение пайплайнов, генерация новых данных, дистиляция знаний из больших LLM в маленькие.
Развитие метрик качества GigaChat-а, например, через оценку способности решать задачи олимпиад международного уровня. Развитие внутреннего LLM-AS-A-JUDGE
Разработка сервиса Lora обучения GigaChat и GigaEmbeder. Повышение стабильности и воспроизводимости запусков, создание пайплайнов валидации и генерации данных с помощью ЛЛМ.
На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.
3-6 лет
Опыт работы
Полная занятость
Тип занятости
Удаленно
Формат работы
Middle
Грейд
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
3-6 лет
Опыт работы
Полная занятость
Тип занятости
Удаленно
Формат работы
Middle
Грейд
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
По компании и стране
По компании и стране