Reach out directly about this role
Разработчик бэкенд-сервисов в Нейроюристе
Команда бэкенда Нейроюриста разрабатывает решение на основе AI для профессиональных юристов. Мы ставим перед собой цель создать такой продукт, выход которого разделит ситуацию на рынке на до и после.
Всего за полгода мы от стадии идеи дошли до запуска в продакшн, по итогам которого реализовали: * одну из лучших legal-моделей в РФ; * быстрый векторный поиск по базе из миллионов документов; * схему гибридного ответа: по пользовательским документам и по законодательной базе; * 10+ уникальных пайплайнов под различные юридические задачи.
Вызовы на текущий момент: * сделать самый удобный продукт для корпоративных юристов в РФ; * перейти к полноценной агентности в сценариях ответа; * расширить базу знаний в несколько раз, не теряя в производительности; * масштабировать on-premises-поставки продукта до десятка крупных клиентов.
Чем мы отличаемся от обычных чат-ботов поверх ChatGPT
Наша команда отвечает за обширный пласт бизнес-логики: чаты, проекты, биллинг и прочее. Кроме того, мы совместно со смежным продуктом Алиса Про строим собственную платформу для создания ML-пайплайнов, позволяющую за считаные часы доводить идею до прода. Наши пайплайны построены на целом ансамбле различных моделей машинного обучения и нередко включают нетривиальную работу с документами, а за работу с качеством отвечает отдельная группа юристов и аналитиков.
Сервисы нашей команды работают как в SaaS, так и в закрытых контурах заказчиков, среди которых ведущие компании РФ в различных областях. Разные схемы поставки нашего продукта концентрируют в команде уникальный опыт работы с широким набором инфраструктурных технологий, применяемых как в Яндексе, так и за его пределами. Отдельно выделяются технологии работы с GPU, например NVIDIA Multi-Instance GPU, Continuous Batching и другие.
Команда работает на острие ML-технологий Яндекса, в числе которых: * модели распознавания текстов с изображений (OCR/VLM); * речевые технологии (Speech-To-Text/Text-To-Speech); * различные модели построения эмбеддингов в рамках векторного поиска; * большие языковые модели.
Технологии * Языки: Go (основной язык), Python (для вспомогательных задач), Bash (скриптовый). * ML-модели: LLM (Alice AI, YaGPT 5.1 Pro и другие), OCR, ASR, VLM, embedders, rerankers. * Инфраструктура SaaS: YDB, YTsaurus, YMQ, Logbroker, S3 Object Storage. * Инфраструктура on-premises: K8s + Helm, Docker, Yandex Cloud AI Studio, YDB/PostgreSQL.
Что о нас пишут * Yandex B2B Tech запустила Нейроюриста — ИИ-помощника для юристов * Нейроюрист: как мы научили нейросеть разбираться в законодательстве и почему ей можно доверить документы * В России запустили специального ИИ-помощника для юристов. И не только
Построение агентского фреймворка У вас будет возможность почти с нуля реализовать core-функциональность для работы агентов поверх нашей платформы для ML-пайплайнов. Среди задач — как техническая проработка решения вместе с командой ML, так и непосредственная реализация, подключение систем мониторинга и логирования и многое другое.
Развитие RAG-платформы Наша команда развивает собственную платформу RAG. Среди задач в этом направлении можно выделить подключение новых видов поиска (полнотекстовый, мультивекторный), оптимизацию скорости ретрива, продвинутую работу с метаданными и другие крутые фичи. Вам предстоит как самостоятельно проектировать новые решения, так и улучшать уже имеющуюся функциональность.
Виджет для работы с документами Большинство задач юристов так или иначе связано с обработкой документов. Поэтому одно из важных направлений нашей работы — создание виджета для встраивания в системы редактирования документов: MS Word, Google Documents, Яндекс Документы. В рамках этого направления вашей задачей будет проработка API и аутентификации в нём. Предстоит тесно работать с командой фронтенда и учитывать особенности работы разных систем редактирования.
Разработка и оптимизация пайплайнов ответа У нас регулярно появляются новые продуктовые запросы от юристов, под которые мы разрабатываем новые команды и сценарии. Вам предстоит погрузиться в устройство нашей ML-платформы, научиться строить поверх неё разные пайплайны и находить в них узкие места. Может понадобиться выносить особо крупные задачи в отдельные модули и делать их переиспользуемыми.
Больше о бэкенде в Яндексе — в канале Yandex for Backend
3-5 years
Experience
Full-time
Employment
Hybrid, Onsite
Work Format
Middle
Grade
Backend
Specialization
AI
Industry
Corporation
Company Type
By city
Backend
Specialization
AI
Industry
Corporation
Company Type