Senior Data Scientist
О компании / Кто мы
Pink Elephant создает и финансирует быстрорастущие стартапы для безопасного доступа к психоделикам и прогрессивной психиатрической помощи.
Наша миссия — создавать компании, которые возглавят революцию в области психического здоровья. Глобальное психическое здоровье — это насущный, недостаточно решаемый кризис: 1 из 8 человек (≈970 млн) страдает психическим расстройством, а только депрессия и тревожность ежегодно обходятся примерно в 1 триллион долларов потерянной производительности. Прогрессивные методы лечения оказываются до 10 раз эффективнее традиционных, но только 5% людей могут получить к ним доступ. Мы здесь, чтобы изменить это, инвестируя в проверенные прорывы и объединяя основателей, клиницистов и операторов, чтобы превратить сегодняшние редкие сеансы в стандарт лечения завтрашнего дня.
Роль
Мы разрабатываем подход нового поколения к диагностике психического здоровья — путем создания высокоточного движка поддержки принятия медицинских решений.
Почему: диагностика в психиатрии сегодня в значительной степени субъективна:
- клиницисты полагаются на личное суждение и разные школы мысли
- решения о лечении (особенно антидепрессантами) часто основаны на методе проб и ошибок
- диагностические инструменты устарели и непоследовательны
Наша цель — сделать диагностику психического здоровья значительно более объективной.
Наша система использует возможности LLM, основанные на структурированных графах медицинских знаний, чтобы предоставить клиницистам поддержку принятия решений на основе фактических данных. Этот диагностический движок будет интегрировать:
- данные, сообщаемые пациентами
- поведенческие сигналы
- новые биомаркеры
- структурированные и неструктурированные медицинские знания
Диагностические системы в области психического здоровья должны перейти от простого «мнения врача» к более объективной, основанной на данных оценке.
Мы ищем специалиста по данным (Data Scientist), который сможет преодолеть разрыв между "черным ящиком" ИИ и безопасной, интерпретируемой клинической практикой.
Обязанности: что вы будете делать
- Инженерия и валидация наборов данных: разработка надежных конвейеров для обработки электронных медицинских карт (EHR) и медицинской литературы. Внедрение строгих многоэтапных фреймворков валидации (анализ чувствительности/специфичности) для обеспечения клинической безопасности и надежности моделей.
- Fine-tuning LLM: адаптация больших языковых моделей с использованием SFT, DPO или PEFT (LoRA/QLoRA) для специализированных медицинских областей и сложной клинической диагностической логики.
- Продвинутый RAG и Graph RAG: проектирование гибридных систем поиска, которые объединяют векторные базы данных с графами знаний, чтобы исключить галлюцинации и обеспечить фактическую обоснованность.
- Объяснимость и интерпретируемость: разработка методов для обеспечения прозрачности выходных данных моделей. Движок должен предоставлять "пути рассуждений" — обосновывая рекомендации, ссылаясь на конкретные медицинские данные, клинические протоколы и связи в графе.
Опыт: что вы принесете
- Стек GenAI: экспертные знания архитектур Transformer и практический опыт fine-tuning LLM (Llama 3, Mistral и т. д.).
- Graph ML: практический опыт работы с графами знаний, Triple-stores или графовыми базами данных (Neo4j, ArangoDB) и графовыми нейронными сетями (GNN).
- Системы поиска: знание LangChain / LlamaIndex и поисковых систем на основе векторов (Pinecone, Milvus или Weaviate).
- Инструменты XAI: практический опыт работы с SHAP, LIME или пользовательскими методами отображения внимания для интерпретируемости моделей.
- Валидация и статистика: сильная теоретическая база в статистической валидации для сред с высокими ставками и обработке несбалансированных «грязных» данных: отсутствие эталонных данных, отсутствие готовых к использованию данных.
- Fine-tuning: выявление важных сигналов и способов их объединения, своевременное выявление ложных выходных данных модели.
Бонусы: почему стоит присоединиться к нам
- Решите проблему "почему": вы будете создавать не просто модель, а систему, которой клиницисты смогут доверять, потому что они понимают ее логику.
- Передовые технологии: работайте на переднем крае ИИ, сочетая LLM со структурированными графами знаний (Graph RAG).
- Значимое социальное влияние: ваша работа напрямую способствует улучшению результатов лечения пациентов, более быстрому выздоровлению и значительному сокращению диагностических ошибок.
Местоположение
Удаленно
Отдел
IT и инфраструктура
Тип занятости
Полная занятость
Минимальный опыт
Опытный