Machine Learning Engineer (TTS)
Мы расширяем нашу команду и ищем квалифицированного, целеустремленного MLE (TTS) для присоединения к нашим командам.
Требования
- 3+ года практического опыта работы с Text-to-Speech (TTS) / синтезом речи.
- Владение Python и фреймворками для глубокого обучения (особенно PyTorch).
- Глубокое понимание методов обработки синтеза речи.
- Опыт работы с моделями на основе быстрого внимания: (FastPitch, FastSpeech 2) и современными вариативными подходами: (например, VITS, Glow-TTS).
- Глубокое понимание техник управления просодией, ритмом и эмоциональной окраской для экспрессивного синтеза речи.
- Знание методов нормализации, FST, нейронных сетей для нормализации.
- Знакомство с методами оценки TTS, включая MOS и A/B-тестирование.
- Знакомство с моделями вокодеров (например, Vocos, HiFi-GAN, mimi).
- Знание обработки сигналов, статистического моделирования и структуры языка.
Обязанности
- Проектирование и оптимизация моделей TTS для обеспечения максимально естественного и точного звучания нашего голосового помощника.
- Тесное сотрудничество с менеджерами по продукту и инженерами для интеграции технологий TTS, делая их плавными и интуитивно понятными для пользователей.
- Взаимодействие с командами по данным для создания эффективных конвейеров аудиоданных: от записи/предварительной обработки речи диктора до обучения моделей.
- Регулярное обновление и доработка моделей TTS для адаптации к различным акцентам, диалектам и стилям речи, повышая удовлетворенность и отзывчивость пользователей.
- Слежение за последними достижениями в области TTS, внедрение инновационных методов и инструментов для поддержания лидирующих позиций в сфере голосового банкинга.
- Тщательное тестирование и валидация моделей для соответствия строгим стандартам.
Мы предлагаем
- Опытная команда: Aiphoria состоит из команды увлеченных профессионалов, создавших отмеченные наградами устройства, голосовые помощники и другие продукты на основе ИИ для корпораций BigTech.
- Передовые технологии: мы создаем технологии, используя наши области экспертизы, включая компьютерное зрение, речевые технологии, понимание естественного языка, генеративный ИИ, в т.ч. LLM и диффузионные модели.
- Быстрое карьерное развитие, способствуемое нашей командой опытных старших профессионалов, пришедших из престижных, ведущих в отрасли компаний.
- Возможности удаленной работы.
- У компании есть известные клиенты, что дает вам возможность работать над разными проектами и/или участвовать в разработке наших собственных продуктов.
- Конкурентная компенсация, превышающая рыночные стандарты.
- Компания с предпринимательским духом. Мы предлагаем уникальное сочетание безопасного рабочего пространства благодаря крупным клиентам вместе с истинной стартап-культурой!