Свяжитесь напрямую по этой вакансии
ML-инженер в команду претрейна синтеза речи
Мы строим универсальный мультиязычный претрейн для TTS, который станет основой для всех наших продуктов: от голосового ассистента и аудиокниг до клонирования голоса и его сохранения при видеопереводе и дубляже.
Одна из ключевых задач команды прямо сейчас — разработка нового нейронного аудиокодека. От него зависит всё: скорость и стоимость обучения, широта интонаций и эмоций, чистота и естественность звука в финальных продуктах.
Разработка семантического аудиокодека Вы будете проектировать, обучать с нуля и масштабировать современные архитектуры нейронных кодеков. Цель — достичь максимального сжатия с минимальными потерями качества и семантической информации.
Работа с большими данными Вам предстоит обучать модели на сотнях тысяч часов мультиязычной речи.
Обучение и масштабирование больших моделей Вы будете обучать большие (несколько B) модели и проводить с ними эксперименты на наших GPU-кластерах — при помощи распределённого обучения.
Оценка и метрики Вам нужно будет придумывать и внедрять автоматические и экспертные метрики для оценки качества звука (чистота, артефакты), выразительности речи и семантической сохранности выходов кодека и претрейна.
Сквозной цикл разработки Вы пройдёте полный путь от исследования (чтение статей, proof-of-concept) до тестирования ваших решений в реальных продуктах.
Больше об ML в Яндексе — в канале Yandex for ML
Если вы хотите построить технологический фундамент для будущего синтеза речи, а также видеть результат своей работы в продуктах, которыми ежедневно пользуются миллионы людей, — присоединяйтесь к команде!
3 лет
Опыт работы
Полная занятость
Тип занятости
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
3 лет
Опыт работы
Полная занятость
Тип занятости
Data Science & ML
Специализация
IT & Tech
Отрасль
Корпорация
Тип компании
По должности
По должности