IT в спорте. Как Data Science меняет футбол
При очередном авиаперелете я накачал себе в кэш yandex музыки различные подкасты, принял удобную положение и начал слушать.
На этот раз это был подкаст «Запуск завтра. IT в спорте. Как Data Science меняет футбол» В данном подкасте ведущие вели беседу с дата-сайентистом работающем в сфере футбола. Он начал рассказывать о том как анализ данных вошел в спорт и начал активно развиваться.
Ниже будет приведены статьи из википедии и блога с сайта sports.ru написанные Максимом Вишневским.
Всё начинается в начале 2000-х в бейсболе. Забегая вперёд скажу, что данная история была экранизирована в 2011 году в фильме «Человек, который изменил всё» с Брэдом Питтом в главной роли.
Сюжет таковой: «Окленд Атлетикс» играет на равных в Серии дивизионов Американской лиги 2001, но проигрывает решающий матч своему сопернику — клубу «Нью-Йорк Янкиз» с зарплатной ведомостью в 114 млн долларов, против 39 млн у «Эйс». Помимо ограниченных финансовых возможностей в межсезонье к проблемам «Атлетикс» добавляется потеря ключевых игроков, которые за высокую зарплату уходят в более богатые клубы Главной лиги бейсбола. Генеральный менеджер «Атлетикс» Билли Бин вынужден искать им замену среди менее удачливых и талантливых бейсболистов и собирать конкурентоспособную команду к сезону 2002 года при ограниченных финансовых возможностях.
Во время визита в Кливленд Билли знакомится с Питером Брендом*, молодым выпускником Йеля, экономистом, который, пользуясь математическими расчётами, предлагает новаторскую схему оценки полезности игроков, исходя из расчёта показателей их личной статистики. Бин выкупает Бренда у «Кливленд Индианс» и делает своим ассистентом.
Бин опробует теорию Бренда и, несмотря на протесты опытнейших скаутов «Атлетикс», набирает команду из малоизвестных или на первый взгляд бесперспективных игроков. Скауты не верят в схему Бренда, согласно которой Бин нанимает трёх недорогих и менее сильных игроков, утверждая, что по своим суммарным статистическим показателям втроём они сумеют заменить одну ушедшую суперзвезду. Ориентируясь на расчёты Бренда, он выбирает игроков, исходя из их процента занятия базы после выхода на биту. Именно так он берёт травмированного кэтчера Скотта Хэттеберга , который никогда не играл на первой базе, бывшую звезду главной лиги 37-летнего Дэвида Джастиса, чья карьера идёт на спад, и молодого питчера Чеда Брэдфорда из низшей лиги с необычной, смешной для профессионалов манерой подачи. Несмотря на состав, набранный Бином, главный тренер «Атлетикс» Арт Хоу оставляет за собой право выбирать состав на каждую игру и постоянно оставляет за бортом новичков Бина. После четырнадцати игр «Атлетикс» занимают последнее место, и, чтобы дать шанс новичкам, в которых уверены они с Брендом, Бин решает продать своих оставшихся «звёзд», в том числе перспективного Карлоса Пенью, чтобы связать Хоу руки и заставить его выпускать на поле новых, хоть и неопробованных, игроков.
Бин убеждает владельца команды, что к середине сезона они выберутся в семёрку лучших. Хоу вынужден работать с тем, что у него есть: он выпускает на поле набранных Бином игроков, и «Атлетикс» начинают выигрывать. Команда одерживает небывалые двадцать побед подряд, установив «вечный» рекорд американской лиги. Несмотря на серию побед, «Атлетикс» проигрывают в первом раунде плей-офф команде «Миннесота Твинс», но Бин, хотя и разочарован поражением, доволен тем, что схема Бренда работает.
В финальной сцене картины Бин включает в своем автомобиле запись с песней The Show, исполненной его дочерью Кейси. Камера плавно делает крупный план лица Бина, в его глазах стоят слёзы. Проникновенная композиция и просьба дочери вынудили его отказаться от должности генерального менеджера «Бостон Ред Сокс», несмотря на зарплату в 12,5 млн долларов в год, которая сделала бы его самым высокооплачиваемым менеджером в истории бейсбола. Сами «Ред Сокс», начиная с серии 2004 года, во время выбора игроков пользуются схемой, которую впервые опробовал Бин. С помощью данной схемы «Бостон Ред Сокс» впервые за 86 лет выигрывают Мировую серию.
*Первоначально роль должна была называться ДеПодеста, а роль - Деметри Мартин, но ДеПодеста не хотел, чтобы его имя или изображение использовалось в фильме, поэтому персонажа назвали Питером Брэндом. Бренд - это смесь помощников Бина в Окленде, неточное представление о каком-либо конкретном человеке.
С этого момента анализ данных вошел в спорт и изменил его.
Рассмотрим же на примере Бенфики, как сейчас это происходит в футболе.
По итогам сезона 2017/2018 Бенфика впервые за 5 лет осталась без чемпионского титула, довольствовавшись серебряными медалями. В Лиге Чемпионов дела пошли и того хуже – ни одного очка в группе с Манчестер Юнайтед, Базелем и ЦСКА. При всем этом, летом 2017 клуб традиционно расстался с рядом ключевых игроков – Семеду перешел в Барселону за 35 миллионов евро, а Эдерсон и Линделеф отправились в Манчестер, принеся в казну еще 75. За последние 7 лет клуб заработал на продажах игроков более 400 миллионов евро, открыв миру Давида Луиса, Анхеля Ди Марию, Яна Облака и многих других.
Португальские клубы уже традиционно зарабатывают огромные деньги на трансферах, а зрители поют дифирамбы скаутским отделам Порту, Бенфики и Спортинга. Однако, помимо выдающейся работы по поиску игроков, в клубах уделяют огромное внимание последующей работе с ними, что и позволяет зачастую «сырым» молодым футболистам значительно прибавлять.
Исследование от ArsTechnica показывает, как устроена работа с технологиями внутри Бенфики и какие дивиденды она приносит.
На базе Бенфики Caixa Futebol Campus располагается семь полей с натуральным покрытием, два с искусственным, собственная лаборатория и общежитие для 65 молодых игроков. В кампусе постоянно тренируется три полноценных команды: Бенфика, Бенфика Б и Бенфика Джуниорс, всего более 100 игроков, и практически каждый аспект их жизни отслеживают, анализируют и улучшают с помощью технологий. Питание, сон, двигательная активность, восстановление, психологическое состояние – все эти данные стекаются воедино и используются для подготовки мировых звезд.
Бенфика тесно сотрудничает с Microsoft: на платформе Azure клуб использует механизмы машинного обучения и предиктивной аналитики, разрабатываемые штатными специалистами по анализу данных. Их совместная работа с тренерским штабом позволяет сформировать индивидуальный план для каждого игрока, развивая сильные стороны, подтягивая слабости и снижая риск получения травм.
Сенсоры, Hawk Eye и сбор данных
Ключевая преграда для использования аналитических систем – доступность данных. Большая часть того, что собирает Бенфика, приходит с сенсоров, но что-то (психология, диеты), можно собрать только вручную. Так как носимые сенсоры – достаточно новая индустрия, ей свойственна крайне низкая степень стандартизации: каждая система использует свои протоколы и файловые форматы. Сотни тысяч значений собираются за каждую игру или тренировочную сессию, что создает огромную проблему для обработки данных с учетом общего числа различных систем. Datatrax во время матчей, Prozone, биосенсоры от Philips Actiware, GPS от Statsports и так далее, в общей сложности более десятка независимых систем. Данные очищаются, приводятся к одному формату и вносятся в огромную базу, для работы который клуб создал собственный дата-центр.
Вот один из примеров того, что собирает клуб:
И оборудование, которое для этого нужно:
По словам CIO (Chief Information Officer) Бенфики Жоао Копето ключевой аспект в работе с подобными данными – приватность, регламентированная законами ЕС. Даже аналитики клуба имеют доступ только к анонимным данным, полная информация доступна лишь узкому кругу руководства.
Технологии постоянно развиваются, и Бенфика активно работает с IT компаниями как над разработкой новых, более надежных и точных сенсоров, так и над внедрением решений схожих с Hawk-Eye. По словам Копето, игрокам почти всегда интересно опробовать новые гаджеты, но постоянное и обязательное их ношение создает проблемы. Технологии компьютерного зрения активно используются в теннисе, снукере и, с недавних пор, в футболе для определения гола. Потенциально, за счет того же принципа – создания 3D модели пространства и движущихся в нём объектов – можно получать больше информации об игроках в процессе тренировок и игр. Базовый GPS используется клубами повсеместно, но даёт лишь информацию о движении. Чтобы оценивать рывки или высоту прыжков нужны более сложные системы.
Машинное обучение для борьбы с травмами
Чтобы выжимать максимум из данных, в Бенфике активно экспериментируют с искусственным интеллектом и машинным обучением - наиболее современным и быстро развивающийся разделом анализа данных, основная идея которого в том, что система обрабатывает большие объемы данных, сама выявляет закономерности и использует их для прогнозирования. Подобные алгоритмы активно внедряются в самых различных сферах и уже приносят видимые результаты. При этом, сфера новая, и, как следствие, отсутствуют шаблоны и наработанные решения. Для Бенфики ключевая сложность в отсутствии профильных специалистов и разрыве между специалистами по данным и людьми, понимающими, что именно требуется для футбольного клуба.
Основная цель на текущий момент – развитие моделей, позволяющих оценивать физическое состояние футболистов и предотвращать травмы. На их основе игроки могут получать индивидуальные планы тренировок, а тренерский штаб – принимать более взвешенные решения по составу на матчи.
Клуб начал собирать данные около 10 лет назад, когда за сезон в основной команде случились 8 серьезных травм. Внедрение научного подхода совпало с падением этого значения, и клуб начал активно инвестировать в анализ данных. При этом, очевидно, что существует ряд серьезных проблем. Во-первых, существуют тысячи показателей, которые могут влиять на риск получения тех или иных травм, и на текущий момент невозможно работать со всеми. Во-вторых, игровые травмы, полученные в результате контактов, невозможно спрогнозировать.
Несмотря на то, что полностью избавиться от травм невозможно, работа с данными дает определенные конкурентные преимущества. Бруно Мендеш, глава лаборатории Бенфики, выпустил в 2016 году исследование, демонстрирующее зависимость риска травмы от отношении резких нагрузок к регулярным (acute:chronic workload ratio). Другими словами, при значительном превышении нагрузок во время матчей над средними во время подготовительного процесса вероятность травм значительно повышается. Используя эти данные, тренеры могут отслеживать нагрузки игроков в рамках недельного цикла и регулировать их для минимизации травм. Или, наоборот, при низких средних нагрузках у игрока (из-за перелетов, болезни или недостаточного усердия) ограничить его участие в матче.
Партнерство между Бенфикой и Microsoft – наглядный и успешный пример объединения компетенций. В данном случае, глубокие знания о футболе от клуба и собранные данные накладываются на опыт в разработке ПО и анализе данных, которым обладает американский IT гигант.
Для Microsoft это возможность развивать платформу Azure, превращающуюся в главный продукт компании, и наращивать знания в спортивной сфере. Менеджеры Microsoft даже планируют открыть исходный код части ПО, созданного в партнёрстве с Бенфикой. Всё - ради доли на стремительно растущем рынке технологий в футболе.
Лучшим же доказательством пользы технологий для Бенфики является сочетание спортивных результатов и прибыльности. Для клуба, не имеющего мировой популярности и английского телеконтракта, крайне важно регулярно получать высокие суммы за своих игроков. Чтобы добиться этого, мало найти самых талантливых, нужно еще помочь им стать лучшими.
Я только начал изучать эту тему и буду дальше выкладывать понравившиеся статьи о применении IT технологий в футболе. До скорых встреч...
Футбол на Пикабу
5.2K постов6K подписчиков
Правила сообщества
На этой странице запрещается:
1.1. Оскорбительное и провокационное поведение с содержанием расизма, национализма и межрелигиозной розни.
1.2. Оскорблять подписчиков.
1.3. Оскорблять игроков
1.4. Устраивать политические разборки.
Отклоняются посты с:
2.1. С необоснованным содержанием мата.
2.2. Баяны.
2.3. Копипаст.
2.4. Рассуждения диванных экспертов.
2.5. Прогнозы
2.5. Реклама