ML-инженер в команду данных синтеза речи

Ищем опытного data- и ML-инженера в команду данных синтеза речи. Команда занимается переводом видео, делает аудиокниги, создаёт голос Алисы. В синтезе наступила эпоха перехода от low resource (даже для основных языков) к большим данным и претрейнам. Новые модели позволяют спеть известные песни вашим голосом и произнести любую фразу всего по нескольким секундам вашего голоса. Основа качества этих моделей — сотни тысяч часов качественных аудиоданных и текстов для них, которые нам предстоит собрать.

Какие задачи вас ждут

Работа с данными Вам предстоит разрабатывать систему хранения действительно больших данных и доступа к ним для ML-разработчиков. В вашем распоряжении будут петабайты аудио, которые необходимо эффективно хранить и уметь быстро обрабатывать.

Майнинг данных Вы будете улучшать пропускную способность текущих пайплайнов сбора данных и масштабировать их для поддержки множества языков, работать с разнородными источниками и разрабатывать процессы майнинга аудиоданных.

Оценивание качества данных Вам предстоит работать с процессами оценивания параметров данных, разрабатывать и применять ML-модели детекции шума, музыки, нескольких голосов, синтетической речи, несовпадения текста и аудио, детекции языка. Эти оценки позволят отфильтровать данные и сделать наш синтез лучшим в мире.

Больше об ML в Яндексе — в канале Yandex for ML

Мы ждём, что вы

Пишете на Python
Строили пайплайны сбора данных для ML
Понимаете, как работать с большими объёмами данных
Применяли на практике, а лучше обучали ML-модели
Мотивированны и готовы глубоко погружаться в область

ML-инженер в команду данных синтеза речи

Какие задачи вас ждут

Больше об ML в Яндексе — в канале Yandex for ML

Мы ждём, что вы

Пишете на Python
Строили пайплайны сбора данных для ML
Понимаете, как работать с большими объёмами данных
Применяли на практике, а лучше обучали ML-модели
Мотивированны и готовы глубоко погружаться в область

ML-инженер в команду данных синтеза речи

Ключевые навыки

Контакты

Средняя заработная плата на позиции

Детали

Какие задачи вас ждут

Мы ждём, что вы

Похожие вакансии

Data Scientist в ML-сервисы Yandex Cloud

ML-разработчик в бригаду приложений голосового ввода

ML-разработчик в команду улучшения качества голоса в Алису

ML-разработчик в команду улучшения качества голоса

Senior ML Engineer (Text-to-Speech)

ML-инженер в команду претрейна синтеза речи

ML-разработчик в розничные риски Яндекс Банка

ML-разработчик в международную рекламу

ML-разработчик в группу качества машинного обучения контент-системы e-сom

Team Lead Data Scientist в клиентский сервис Crowd

ML-разработчик в команду генеративных еком-сценариев (LLM)

ML-инженер в Карты

ML-инженер в команду данных синтеза речи

Ключевые навыки

Контакты

Средняя заработная плата на позиции

Детали

Какие задачи вас ждут

Мы ждём, что вы

Похожие вакансии

Data Scientist в ML-сервисы Yandex Cloud

ML-разработчик в бригаду приложений голосового ввода

ML-разработчик в команду улучшения качества голоса в Алису

ML-разработчик в команду улучшения качества голоса

Senior ML Engineer (Text-to-Speech)

ML-инженер в команду претрейна синтеза речи

ML-разработчик в розничные риски Яндекс Банка

ML-разработчик в международную рекламу

ML-разработчик в группу качества машинного обучения контент-системы e-сom

Team Lead Data Scientist в клиентский сервис Crowd

ML-разработчик в команду генеративных еком-сценариев (LLM)

ML-инженер в Карты