Data Scientist
О AIstats
AIstats меняет рынок футбольных данных, переходя от 2D к 3D с помощью передовой экосистемы компьютерного зрения и машинного обучения, которая открывает глубокие инсайты как для болельщиков, так и для профессионалов.
За 1.5 года стартап из Варшавы с белорусскими корнями вырос с $0 до $3 млн ARR и привлек более $2 млн финансирования. Будучи AI-first стартапом, мы ищем увлеченных разработчиков, которые хотят создать что-то великое и вместе с нами формировать будущее футбольной аналитики.
Что мы создаем
- AIstats Mobile — мобильное приложение для футбольных болельщиков и бетторов, которое менее чем за год достигло 100 тыс. MAU и включает расширенную статистику, основанную на наших проприетарных технологиях машинного обучения и компьютерного зрения.
- AIstats Platform — аналитическая платформа нового поколения, помогающая футбольным клубам, скаутам и агентам принимать более взвешенные решения как на поле, так и на трансферном рынке. Благодаря нашему раннему лидерству в области данных по отслеживанию скелета, AIstats за несколько месяцев после запуска платформы заключил партнерства с несколькими клубами Tier-1.
Обязанности
- Разработка и улучшение статистических моделей и моделей машинного обучения
- Анализ больших наборов данных с использованием Python и SQL
- Проведение статистического анализа, проверки гипотез и оценки экспериментов
- Создание интерпретируемых ML-решений и объяснение поведения моделей
- Сотрудничество с кросс-функциональными командами в рамках инициатив, основанных на данных
Требования
- 3+ года опыта работы в качестве Data Scientist
- Отличные навыки работы с Python, включая NumPy, Pandas и scikit-learn
- Глубокие знания SQL; R — плюс
- Четкое понимание теории вероятностей и математической статистики
- Опыт статистического тестирования: t-test, χ², ANOVA, Mann-Whitney, Wilcoxon, KS test, bootstrap/permutation tests, коррекции Бонферрони и FDR
- Практический опыт работы с XGBoost, LightGBM и CatBoost
- Понимание байесовских методов
- Опыт работы с продольными/панельными данными, смешанными/фиксированными/случайными эффектами и повторными измерениями
- Опыт работы с интерпретируемыми ML-подходами: GAM, SHAP, partial dependence, контрфактический анализ
Желательно (Nice to Have)
- Опыт работы с глубоким обучением: Transformers, attention mechanisms, RNN/LSTM
- Знание графовых нейронных сетей (Graph Neural Networks)
- Опыт работы с обучением с подкреплением (Reinforcement Learning): PPO, MAPPO, MAT, multi-agent RL
- Знакомство с Google Research Football или аналогичными средами
- Продвинутая байесовская статистика: PyMC, Stan, numpyro, MCMC, иерархические модели
- Опыт работы с причинно-следственным анализом (causal inference): DAGs, инструментальные переменные, разность разностей (difference-in-differences)
- Знание вероятностных пространственных моделей: марковские цепи, HMM/DBN, MRF/CRF, гауссовские процессы
Что мы предлагаем
- Полностью удаленный формат работы;
- Гибкое начало рабочего дня и удобный график;
- Стабильная конкурентная заработная плата, привязанная к USD;
- 24 дня оплачиваемого отпуска и 15 дополнительных оплачиваемых выходных дней (включая больничные, корпоративные праздники и национальные/религиозные праздники);
- Дружелюбная культура общения, отличный продукт и прозрачные процессы;
- Динамичная рабочая среда с увлеченной командой, любящей спорт и технологии;
- Возможности для профессионального роста и карьерного развития;
- Отсутствие микроменеджмента — только доверие, автономия и свобода для экспериментов.